Foros del Web » Programando para Internet » PHP »

Problema al parsear web

Estas en el tema de Problema al parsear web en el foro de PHP en Foros del Web. Wenas, llevo bastante tiempo parseando y jamás se me ocurrió pensar que aún existian webs de uso actual y masivo con una estructura basada en ...
  #1 (permalink)  
Antiguo 21/09/2014, 09:07
 
Fecha de Ingreso: julio-2014
Mensajes: 334
Antigüedad: 10 años, 4 meses
Puntos: 30
Problema al parsear web

Wenas, llevo bastante tiempo parseando y jamás se me ocurrió pensar que aún existian webs de uso actual y masivo con una estructura basada en frames.

Total, que me puse a crear el código para parsear y resulta que no me devuelve nada y carámba!! Después caigo en la cuenta que estoy haciendo un parsing desde el servidor y que me va ha ser imposible parsear un frame, ya que se muestra en el lado del cliente...

Miré si se podía hacer un parsing desde javascript al frame y con el código de la web que carga el frame, pasarlo a php, pero nada, tampoco muestra el código de esa web del frame.

Se me ocurrió cargar directamente esa web del frame en una ventana nueva y bueno, resulta que no muestra todos los datos correctos si no se carga con los demás frames así que estoy estancado de cómo puedo yo acceder a esa web DENTRO de ese frame.

La web de la que hablo es Aldaba, si le dais a "por áreas" os saldrán una lista de áreas (ese el el frame que quiero parsear y se llama "frame name="Display", si lo cargais a parte en otra ventana, vereis que no salen los mismos datos y mucho menos se pueden acceder a las ofertas de trabajo ya que lanza error.

A ver si alguien puede tener una idea de cómo hacer eso.

NOTA: lo he probado con cURL, el simple_html_dom y javascript. Mismo resultado.

Última edición por Triby2; 21/09/2014 a las 09:08 Razón: error

Etiquetas: html, parsear
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 23:19.