Foros del Web » Programando para Internet » PHP »

bot de la wikipedia

Estas en el tema de bot de la wikipedia en el foro de PHP en Foros del Web. Buenas a todos, estoy haciendo un bot de la wikipedia que consiste en entrar en la wikipedia y aspirar algunos datos importantes, parsearlos e insertarlos ...
  #1 (permalink)  
Antiguo 31/01/2012, 06:46
 
Fecha de Ingreso: febrero-2011
Mensajes: 78
Antigüedad: 13 años, 9 meses
Puntos: 0
bot de la wikipedia

Buenas a todos, estoy haciendo un bot de la wikipedia que consiste en entrar en la wikipedia y aspirar algunos datos importantes, parsearlos e insertarlos en base de datos para su posterior uso.
Mi problema es el siguiente: tengo este enlace donde la variable concatenada city puede ser cualquier ciudad/pais.


http://es.wikipedia.org/w/api.php?action=query&format=php&prop=revisions&tit les='.$city.'&rvprop=content

si lo abris os descargará el artículo de la wikipedia. El problema es que viene el texto muy sucio. Alguien sabe como tratar este texto para que quede limpio??
  #2 (permalink)  
Antiguo 04/02/2012, 10:33
Avatar de repara2  
Fecha de Ingreso: septiembre-2010
Ubicación: München
Mensajes: 2.445
Antigüedad: 14 años, 2 meses
Puntos: 331
Respuesta: bot de la wikipedia

Qué significa código sucio?
__________________
Fere libenter homines, id quod volunt, credunt.

Etiquetas: bot, wikipedia, variables
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 16:22.