20/12/2008, 17:10
|
| | Fecha de Ingreso: mayo-2002
Mensajes: 32
Antigüedad: 22 años, 8 meses Puntos: 0 | |
Java+Xml+Xml schema Hola que tal:
Estoy diseñando una aplicacion que recoge la informacion desde paginas web.
Hasta el momento consigo formar archivos XML utilizando los tags del Html y tambien consigo recuperar la informacion. Mi principal problema es que esto puede traer problemas a la base de datos si se modifican las paginas web.
He estado leyendo que es posible comparar el esquema de un xml con varios xml y saber si existe alguna diferencia en su estructura lo que me podria indicar que se estructuro la pagina web. Mi objetivo ahora es generar un esquema xml a partir de un xml y luego comparalos cada vez que se realice la extraccion de la informacion con el objetivo de conocer si hay cambio.
Nose si el procedimiento que estoy realizando para obtener la informacion del html es un poco engorroso y desconzco si existe algo mas sencillo para hacer esto, pero lo comento por si alguien tiene un metodo mejor.
- primero descargo la web.
- utilizo Xpath para navegar el html y encontrar la informacion etiquetadas extrayendo ese segmento del html.
- utilizo una API para xml para navegar este segmento extrayendo la informacion
de los nodos.
Todo este procedimiento me implica la generacion de archivos los que concluyen
con un archivo xml de la informacion. utilizo diferentes API para llegar a esto.
Y es aqui mi problema, no consigo comparar ni obtener de manera optima los esquemas de los xml, alguien ha podido comparar xml a traves de esquemas?
Saludos y gracias por su respuesta |