Ver Mensaje Individual
  #1 (permalink)  
Antiguo 11/09/2012, 20:50
Avatar de xarmagedonx
xarmagedonx
 
Fecha de Ingreso: marzo-2009
Mensajes: 360
Antigüedad: 15 años, 8 meses
Puntos: 29
Busqueda Extraer <title> con DOM en PHP

Hola compañeros de FDW!!

Busqué por Google y distintos sitios como extraer el titulo de una página, pero no encontré lo que buscaba.

Estoy extrayendo todos los enlaces de un sitio web, pero quiero obtener ahora todos los titulos de cada una de las páginas.

La sección de código que utilizo es la siguiente:

Código PHP:
Ver original
  1. [...]
  2. $dom = new DOMDocument();
  3. @$dom->loadHTML($html);
  4.  
  5. for ($i = 0; $i < $hrefs->length; $i++) {
  6.     $href = $hrefs->item($i);
  7.     $url = $href->getAttribute('href');
  8. [...]

Con Curl descargo la página y luego con DOM, obtengo los links, el código que uso actualmente para extraer el titulo es el siguiente:

Código PHP:
Ver original
  1. preg_match_all ("(<title>(.*)</title>)siU", $html, $title);
Pero esto no funciona, ya que solo extrae el titulo de la página inicial. ¿Cómo puedo lograr que se extraiga el titulo de cada link?

Muchas gracias a todos!