Ver Mensaje Individual
  #1 (permalink)  
Antiguo 15/10/2011, 10:11
Avatar de jja
jja
 
Fecha de Ingreso: diciembre-2010
Ubicación: BCN
Mensajes: 47
Antigüedad: 13 años, 10 meses
Puntos: 0
Pregunta Leer html de página que devuelve error 404 con urllib2.urlopen

Buenas a todos,

Estoy haciendo una aplicación en Python que solicita páginas Web de un Sitio Web, y analiza el texto contenido en las páginas de error 404.

El problema con el que me encuentro es que si el Sitio Web devuelve un error 404, me salta la excepción de dicho error y no me deja acceder al contenido del HTML de la página:

Código:
try:
	f = urllib2.urlopen(page)
	f.close()
	return "Pagina correcta"
except urllib2.HTTPError, e:
	return e.reason
¿Sabéis como podría ver el contenido del HTML de las páginas que devuelven errores 404?

Gracias saludos!
__________________
El supremo arte de la guerra es someter al enemigo sin luchar.

Sun Tzu