Hola, estoy intentando leer informacion de paginasamarillas.es con php. Pero me ocurre un problema que no se explicar.
Si entras en
www.paginasamarillas.es funciona perfectamente y sin problemas.
Sin embargo si intento leer algo de la pagina con readfile() por ejemplo me da un error "500 Internal Server Error".
Incluso haciendo:
Código:
print_r(get_headers("http://www.paginasamarillas.es/"));
el resultado es:
Código:
Array
(
[0] => HTTP/1.1 500 Internal Server Error
[1] => Date: Fri, 13 Aug 2010 09:12:50 GMT
[2] => Vary: Accept-Encoding
[3] => Content-Length: 534
[4] => Content-Type: text/html; charset=iso-8859-1
[5] => Cache-Control: max-age=0
[6] => Expires: Fri, 13 Aug 2010 09:12:50 GMT
[7] => Connection: close
)
Es algo muy extraño ya que como podeis comprobar, la web funciona perfectamente y no da ningun error.
Tambien he probado a modificar los headers antes de leer la pagina. Pero tampoco vá.
Código:
header('GET: HTTP/1.1');
header('Host: www.paginasamarillas.es');
header('User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; es-ES; rv:1.9.2.8) Gecko/20100722 AlexaToolbar/alxf-1.54 Firefox/3.6.8');
header('Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8');
header('Accept-Language: es-es,es;q=0.8,en-us;q=0.5,en;q=0.3');
header('Accept-Encoding: gzip,deflate');
header('Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7');
header('Keep-Alive: 115');
header('Connection: keep-alive');
¿Alguien sabria decirme porque ocurre esto? Espero que algun guru lo entienda porque yo no se que mas probar.