Hola amig@s;
Necesito hacer una aplicación que busque palabras en determinada web.
Lo he hecho (a grosso modo) así:
Código PHP:
//abró una web como si fuera un archivo y guardo todo su contenido, en función de la web $datafile puede contener bastante información.
$dataFile=fopen($web,"r")//$web contiene la web a analizar
if($dataFile )
{
$buffer="";
while (!feof($dataFile))
{
$buffer.=fread($dataFile, 1024);
}
fclose($dataFile);
}
//vector con las palabras a buscar, estos vectores pueden ser de al menos 30 palabras
$palabra[]="palabra1";
$palabra[]="palabra2":
$palabra[]="palabra3";
foreach($palabra as $index)
{
$total+=substr_count($buffer,$index);
}
echo $total;
El problema que tengo con todo esto es que el resultado no se ajusta muy bien a lo que existe, es decir, hay palabras que existen en la web y que no soy capaz de detectar. No se si la función substr_count es adecuada para lo que hago, o si tiene limitaciones (busco las palabras tanto en mayúsculas y minísculas, se que lo tiene en cuenta).
A ver si alguién me dice como afinar un poco más a la hora de buscar estas palabras.
Gracias de antemano.