he hecho un script que copia el html de una url, y analiza todos los dominios que tiene, por ejemplo:
forosdelweb.com
bqkdjuqhb jfhnj jdkm huijrk huhqjnmpo -- hdefasnkn jin
bqkdjuqhb jfhilkj jdkm huijrk huhqjnmpo -- hdefasnkn jin
maestroselweb.com
bqkdjuqhb jfhnj jdkm huijrk huhqjnmpo -- hdefasnkn jin
bqkdjtyuiopñ´tyjtkj vvvvvvvtyhjkjh
para obtener en un vector lo siguiente:
vector[1]=
forosdelweb.com
vector[2]=maestroselweb.com
vector[3].........
uso esto:
Código PHP:
$contenido = file_get_contents("/tmp/uno.html");
preg_match_all('/([a-zA-Z0-9\.-]+)\.([a-zA-Z]{2,4})$/',$contenido, $vector );
foreach ($vector as $set)
{
foreach ($set as $item)
{ print "$item ... "; }
echo ("<br>");
}
la expresión regular parece correcta, porque la he probado en un software visual de expresiones regulares, sobre un texto d prueba y funciona correctamente. Pero pqarece que el vector está vacio.
gracias por adelantado!