Foros del Web - Ver Mensaje Individual

razpeitia · #2 (**permalink**) 18/04/2011, 21:30

Bueno primero lo primero. Lo que estas reemplazando se llaman HTML Entities lista de HTML entities ISO-8859-1

Ahora, claro que existe una mejor forma y esa es usar un parser html como lxml. Ejemplo:

Código Python:

Ver original>>> t = lxml.html.fromstring("&aacute;")
>>> t
<Element p at 0x2350930>
>>> t.text_content()
u'\xe1'
>>> print t.text_content()
á