
20/08/2003, 09:36
|
| | Fecha de Ingreso: agosto-2003
Mensajes: 68
Antigüedad: 21 años, 7 meses Puntos: 0 | |
Ok,
Eso es correcto, estaba errado.
Por ahora tengo lo siguiente:
1) Defino el url que quiero chequear
$url = "http://www.search1web.com/link.htm";
2) Aplico la función show_source($url):
show_source ( $url );
$contents = ob_get_contents();
ob_end_clean();
$t = $contents;
3) Si quiero sacar el titulo de la pagina aplico este scrip:
$t= ereg_replace("</title>"," </title>",$t);
$t = ereg('.*title>([^<$]* )',$t,$w);
echo $w[1];
3.1) $t = ereg_replace("</title>"," </title>",$t);
Con este, lo que hago es darle un espacio entre la
ultima palabra del titulo y el comando </title>, esto lo
hago para evitar que la ultima palabra sea borra al
aplicar el siguiente scrip que extrae el titulo de la pagina
3.2 $t = ereg('.*title>([^<$]* )',$t,$w);
Con esto extraigo el contenido entre el comando
<title>...</title>. Para que me pudiera funcionar tuve
que usar el código html para el carácter ‘>’, esto con la
finalidad de que a partir de aquí era donde extraería el
contenido del titulo.
3.3) echo $w[1];
y con esto lo pruebo.
Me funciono, pero no se si hay otra forma de hacerlo o si tengo un error en le planteamiento. Le agradezco su comentario.
Ahora voy a tratar de extraer los metas (description y keyword) que entiendo que hay una función de php que lo hace. Luego les digo.
Gracias
Última edición por yoelis; 20/08/2003 a las 09:46 |