Ver Mensaje Individual
  #6 (permalink)  
Antiguo 02/04/2015, 05:43
Avatar de Profesor_Falken
Profesor_Falken
 
Fecha de Ingreso: agosto-2014
Ubicación: Mountain View
Mensajes: 1.323
Antigüedad: 10 años, 3 meses
Puntos: 182
Respuesta: Extracción de información de web que ejecuta script antes de mostrarse

Buenas,

En ese caso tendras que utilizar efectivamente un browser que se ejecute en segundo plano y pueda interpretar el javascript.

Las opciones mas logicas serian Selenium y HTMLUnit.
http://www.seleniumhq.org/
http://htmlunit.sourceforge.net/

Selenium se basa en los drivers de rendering de los propios navegadores (webkit y gecko).

HTMLUnit es una implementacion de un navegador hecha desde cero en java por lo que no depende de drivers externos. Es mas rapida, pero su implementacion e interpretacion de javascript puede no ser tan precisa y potente como la que hacen los navegadores.

Yo he utilizado mucho Selenium y funciona bastante bien. HTMLUnit, ni idea...


Un saludo
__________________
If to err is human, then programmers are the most human of us