Bueno primero lo primero. Lo que estas reemplazando se llaman
HTML Entities lista de
HTML entities ISO-8859-1
Ahora, claro que existe una mejor forma y esa es usar un parser html como
lxml. Ejemplo:
Código Python:
Ver original>>> t = lxml.html.fromstring("á")
>>> t
<Element p at 0x2350930>
>>> t.text_content()
u'\xe1'
>>> print t.text_content()
á