Hola!, probé el código, pero no funciona =S, me marca Undefined offset: 0, y después Error en la inserción de datos.
Pensé hacer un cambio en el código también...
Esta parte del código:
Podría ser reemplazado con esto:
Código PHP:
Ver original$keyw = preg_match_all ("(<meta name=\"keywords\" content=\"(.*)\"\/>)siU", $html, $keys); if ($keyw !== false){
$h1 = $encabezado1[1][0];
$b = $bold[1][0];
}
En caso de que meta keywords no retorne nada, se extrae el encabezado1 o h1, se podría seguir extendiendo utilizando h2,h3,h4...etc, también extrae todos los bold (<b></b>), de esta manera se reemplaza la meta por los encabezados y negrita.
Saludos!
EDITO: Tenía un código viejo del webcrawler, que funciona mejor para las meta description y keywords:
Código PHP:
Ver originalfor ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url2 = $href->getAttribute('href');
if($href->getAttribute('name') == 'description')
$descripcion = $href->getAttribute('content');
if($href->getAttribute('name') == 'keywords')
$keywords = $href->getAttribute('content');