Foros del Web » Programando para Internet » PHP »

Como Rastrear

Estas en el tema de Como Rastrear en el foro de PHP en Foros del Web. Hola amigos/as ésta es la cosa más difícil que he tenido que plantear en este foro, o al menos para mi es lo más difícil. ...
  #1 (permalink)  
Antiguo 03/03/2014, 06:15
Avatar de Benderzuelo  
Fecha de Ingreso: mayo-2013
Ubicación: España
Mensajes: 223
Antigüedad: 11 años, 5 meses
Puntos: 5
Como Rastrear

Hola amigos/as

ésta es la cosa más difícil que he tenido que plantear en este foro, o al menos para mi es lo más difícil.

Me han pedido que fabrique una aplicación que pueda obtener datos de otras paginas web.

Por ejemplo si quiere rastrear empleos en páginas de empleos y guardar solo los empleos referentes a la categoría por ejemplo electricista.

Como puedo con PHP acceder a datos de otras webs y guardarlos en mi base de datos, seria como hacer un filtro, por ejemplo si quiero obtener solo los pisos en alquiler de particulares de barcelona del portal milanuncios...

Cómo podría hacerlo?

Muchas gracias de antemano
  #2 (permalink)  
Antiguo 03/03/2014, 06:23
Avatar de Heli0s  
Fecha de Ingreso: abril-2010
Mensajes: 789
Antigüedad: 14 años, 7 meses
Puntos: 40
Respuesta: Como Rastrear

Tienes que estudiar de que manera usa las URL el portal milanuncios para adaptarte y hacer la petición correcta, después con la función file_get_contents() para recoger el código fuente, el cual debes procesar para recoger los datos que necesites.

Un saludo
  #3 (permalink)  
Antiguo 04/03/2014, 06:14
Avatar de Benderzuelo  
Fecha de Ingreso: mayo-2013
Ubicación: España
Mensajes: 223
Antigüedad: 11 años, 5 meses
Puntos: 5
Respuesta: Como Rastrear

Si esa función la conocia pero no se usarla bien.

Me dijeron que tenia que hacer algo así:

Código PHP:
Ver original
  1. $ch = curl_init();  
  2.                 curl_setopt($ch, CURLOPT_REFERER, 'http://www.idealista.com');
  3.                 curl_setopt($ch, CURLOPT_URL, $url);  
  4.                 curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
  5.                 curl_setopt($ch, CURLOPT_USERAGENT, $agents);
  6.                 curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); contents.
  7.                 curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1); this
  8.                 $data = curl_exec($ch);
  9.                 curl_close($ch);  
  10.  
  11.                 $doc = new DOMDocument();
  12.                 $doc->loadHTML($data);
  13.                 $xpath = new DOMXPath($doc);
  14.                    
  15.  
  16.                  // aqui se recogen los partametros, seria esto por cada div
  17.                  $location_node = $xpath->query("div[@class='location']/p", $list_data);
  18.                  $ar_Location = explode('.', $location_node->item(0)->nodeValue);
  19.                  $direccion = $ar_Location[0];

El problema es que no entiendo na de ná..

Algún alma caritativa me podría explicar que es y como usarlo por favor?

Gracias por adelantado

Etiquetas: rastrear
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 22:42.