03/10/2011, 19:39
|
| | Fecha de Ingreso: abril-2010 Ubicación: Rosario
Mensajes: 1.850
Antigüedad: 14 años, 7 meses Puntos: 228 | |
Problema con codificacion de caracteres. Estoy usando urllib2 y minidom de xml para leer y pasear partes de una pagina. Pero me tope que cierta parte de una pagina tiene el siguiente caracter: ° y entonces el minidom falla al parsear la pagina.
Mi pregunta es como hago para eliminar ese caracter, y algun otro caracter que se puede interponer??
Se que es problema del Unicode y del ASCII, probe un par de metodos casetos que encontre por otros lados pero no logre dar en la tecla.
Saludos |