Buenas a todos,
Estoy haciendo una aplicación en Python que solicita páginas Web de un Sitio Web, y analiza el texto contenido en las páginas de error 404.
El problema con el que me encuentro es que si el Sitio Web devuelve un error 404, me salta la excepción de dicho error y no me deja acceder al contenido del HTML de la página:
Código:
try:
f = urllib2.urlopen(page)
f.close()
return "Pagina correcta"
except urllib2.HTTPError, e:
return e.reason
¿Sabéis como podría ver el contenido del HTML de las páginas que devuelven errores 404?
Gracias saludos!