Código PHP:
Ver original<?php
if(!$server_link) {
}
if(!$db_selected) {
}
function storeLink($titulo,$descripcion,$url,$keywords)
{
$query = "INSERT INTO spider (webTitulo, webDescripcion, weburl, webkeywords) VALUES ('$titulo', '$descripcion', '$url', '$keywords')";
}
function extraer($url, $prof, $patron)
{
$userAgent = 'Interredu';
if (!$html) {
}
$dom = new DOMDocument();
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url2 = $href->getAttribute('href');
$var = strstr($url2, '#', true); if ($var !== false ) {
$url2 = $var;
}
if ($url2 != $url && $url2 != '') {
if (saveUrl($url2, $prof,$patron, $html)) {
extraer($url2, $prof ++, $patron);
}
}
}
}
function saveUrl($url, $prof, $patron, $html)
{
$retorno = false;
$busqueda = mysql_query("SELECT weburl FROM spider WHERE weburl='$url'");
if( $prof <= 1 and $cantidad == 0 and $pos !== false) {
preg_match_all ("(<meta name=\"description\" content=\"(.*)\"\/>)siU", $html, $description); preg_match_all ("(<meta name=\"keywords\" content=\"(.*)\"\/>)siU", $html, $keys); $titulo = $title[1][0];
$descripcion = $description[1][0];
$keywords = $keys[1][0];
storeLink($titulo,$descripcion,$url,$keywords);
$retorno = true;
echo 'Guardada pagina : ' . $url . ' con profundidad ' . $prof . '<br>' . "\n\r";
}
return $retorno;
}
$url = "http://www.forosdelweb.com/f18";
$patron = "http://www.forosdelweb.com/f18";
$prof = 1;
extraer($url, 1, $patron);
Tienes que refinar metas y keywoards,
Cuando lo tengas mas refinado me lo pasas.
Saludos