Foros del Web » Programando para Internet » PHP »

parsear lenguaje wikipedia xml

Estas en el tema de parsear lenguaje wikipedia xml en el foro de PHP en Foros del Web. buenas, estoy tratando de parsear un texto de wikipedia, pero no quiero hacerlo manualmente, y estoy seguro que hay alguna libreria por ahi que me ...
  #1 (permalink)  
Antiguo 06/06/2011, 17:12
 
Fecha de Ingreso: mayo-2005
Mensajes: 164
Antigüedad: 19 años, 6 meses
Puntos: 0
parsear lenguaje wikipedia xml

buenas, estoy tratando de parsear un texto de wikipedia, pero no quiero hacerlo manualmente, y estoy seguro que hay alguna libreria por ahi que me ayude a hacerlo.

este es el link:

http://en.wikipedia.org/wiki/Special:Export/Train

como podria formatear este xml?

mil gracias por su ayuda!
  #2 (permalink)  
Antiguo 06/06/2011, 17:43
Avatar de memoadian
Colaborador
 
Fecha de Ingreso: junio-2009
Ubicación: <?php echo 'México'?>
Mensajes: 3.696
Antigüedad: 15 años, 4 meses
Puntos: 641
Respuesta: parsear lenguaje wikipedia xml

recomiendan mucho simple_xml
  #3 (permalink)  
Antiguo 06/06/2011, 21:56
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años, 5 meses
Puntos: 1517
Respuesta: parsear lenguaje wikipedia xml

Con DOM o SimpleXML. Pasa por el área de aportes de este foro para que veas un tema que te puede ayudar a trabajar con xml usando cualesquiera de esas dos librerías.
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos
  #4 (permalink)  
Antiguo 07/06/2011, 02:15
 
Fecha de Ingreso: mayo-2005
Mensajes: 164
Antigüedad: 19 años, 6 meses
Puntos: 0
Respuesta: parsear lenguaje wikipedia xml

gracias por las respuestas! claro, pero una vez tenga el texto (ver el link que puse) del nudo <text xml:space="preserve" bytes="29302"> como puedo formatear los links, separaciones, etc como ocurre en wikipedia, por ejemplo:

A '''train''' is a connected series of vehicles for [[rail transport]] that move along a [[Rail tracks|track]]

yo se que [[..]] son links, pero hay muchos mas tags que no los puedo definir, y queria saber si hay alguna libreria que me limpie todos estso tags y los convierta como en wikipedia.

gracias!
  #5 (permalink)  
Antiguo 07/06/2011, 05:00
Avatar de abimaelrc
Colaborador
 
Fecha de Ingreso: mayo-2009
Ubicación: En el planeta de Puerto Rico
Mensajes: 14.734
Antigüedad: 15 años, 5 meses
Puntos: 1517
Respuesta: parsear lenguaje wikipedia xml

Trata la librería Text_Wiki
__________________
Verifica antes de preguntar.
Los verdaderos amigos se hieren con la verdad, para no perderlos con la mentira. - Eugenio Maria de Hostos

Etiquetas: parsear, wikipedia, xml
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 18:34.