Ver Mensaje Individual
  #1 (permalink)  
Antiguo 08/12/2012, 16:07
carbon
 
Fecha de Ingreso: enero-2012
Ubicación: Buenos Aires
Mensajes: 745
Antigüedad: 12 años, 10 meses
Puntos: 35
Beautiful Soup

Hola a todos. Voy directo al problema. Tengo el siguiente código:

Código Python:
Ver original
  1. >>> from bs4 import BeautifulSoup
  2. >>>
  3. >>> doc = "<html><p>Peter&# 39;s house</p></html>"
  4. >>> text = BeautifulSoup(doc).get_text()
  5. >>> text
  6. u"Peter's house"

Hay alguna manera de hacer eso mismo (remover el código html) sin que convierta el &# 39; (lo escribo separado para que se visualice) en el caracter correspondiente?
No he encontrado alguna solución en la documentación.

Gracias desde ya!