Ver Mensaje Individual
  #9 (permalink)  
Antiguo 27/04/2013, 03:45
angelo087
 
Fecha de Ingreso: marzo-2010
Mensajes: 29
Antigüedad: 15 años
Puntos: 1
Respuesta: Obtener Código HTML de una Web

Hola de nuevo a todos.

Después de varios días sin dar señales de vida creo haber obtenido la solución y me gustaría compartirla con vosotros.

Hice uso de HTMLUnit. Son unas librerías que puedes usar desde java para conectarte a cualquier página web y realizar lo que desees como si estuvieras delante del propio navegador.

Esta técnica es lo que se conoce como "web scrapping" y lo que hice fue simular a una persona que entra en esa web, poner los términos de búsqueda y darle al botón de aceptar. El resultado que obtengo es el código HTML que andaba buscando.

La verdad es que está bien, puesto que si el código que se busca no se encuentra debido a que tienes que ejecutar los script de java y demás..esto puede servir.

He hecho un par de pruebas y he seguido unos ejemplos y funciona, si alguien quiere echarle un ojo comparto por aquí el enlace de HTMLUnit por si alguien no lo conoce.

http://htmlunit.sourceforge.net/

Gracias a ambos por sus respuestas.

Saludos.