Hola a todos. Voy directo al problema. Tengo el siguiente código:
Código Python:
Ver original>>> from bs4 import BeautifulSoup
>>>
>>> doc = "<html><p>Peter&# 39;s house</p></html>"
>>> text = BeautifulSoup(doc).get_text()
>>> text
u"Peter's house"
Hay alguna manera de hacer eso mismo (remover el código html) sin que convierta el
&# 39; (lo escribo separado para que se visualice) en el caracter correspondiente?
No he encontrado alguna solución en la documentación.
Gracias desde ya!