Código Python:
Ver original
>>> from bs4 import BeautifulSoup >>> >>> doc = "<html><p>Peter&# 39;s house</p></html>" >>> text = BeautifulSoup(doc).get_text() >>> text u"Peter's house"
Hay alguna manera de hacer eso mismo (remover el código html) sin que convierta el &# 39; (lo escribo separado para que se visualice) en el caracter correspondiente?
No he encontrado alguna solución en la documentación.
Gracias desde ya!