Foros del Web - Ver Mensaje Individual - Leer html de página que devuelve error 404 con urllib2.urlopen

jja · #1 (**permalink**) 15/10/2011, 10:11

Buenas a todos,

Estoy haciendo una aplicación en Python que solicita páginas Web de un Sitio Web, y analiza el texto contenido en las páginas de error 404.

El problema con el que me encuentro es que si el Sitio Web devuelve un error 404, me salta la excepción de dicho error y no me deja acceder al contenido del HTML de la página:

Código:

try:
	f = urllib2.urlopen(page)
	f.close()
	return "Pagina correcta"
except urllib2.HTTPError, e:
	return e.reason

¿Sabéis como podría ver el contenido del HTML de las páginas que devuelven errores 404?

Gracias saludos!