Ver Mensaje Individual
  #1 (permalink)  
Antiguo 31/01/2012, 06:46
tabelor
 
Fecha de Ingreso: febrero-2011
Mensajes: 78
Antigüedad: 13 años, 9 meses
Puntos: 0
bot de la wikipedia

Buenas a todos, estoy haciendo un bot de la wikipedia que consiste en entrar en la wikipedia y aspirar algunos datos importantes, parsearlos e insertarlos en base de datos para su posterior uso.
Mi problema es el siguiente: tengo este enlace donde la variable concatenada city puede ser cualquier ciudad/pais.


http://es.wikipedia.org/w/api.php?action=query&format=php&prop=revisions&tit les='.$city.'&rvprop=content

si lo abris os descargará el artículo de la wikipedia. El problema es que viene el texto muy sucio. Alguien sabe como tratar este texto para que quede limpio??