estoy trabajando en un proyecto de notcias en el cual se necesita sacar un extracto de la misma, en varias paginas existe rss pero en otras no, en estas ultimas necesito sacar las primeras lineas de la noticia, he estado tratando con regex, al final pongo el codigo.
El problema es que cada pagina es diferente y no es practico realizar un llamado para cada una de ellas, ¿existira alguna forma de solo sacar esa información?
Código PHP:
$input2 = @file_get_contents($url) or die("Could not access file: $url");
$regexp2 = "<div(.*)>(.*)<\/div>";
if(preg_match_all("/$regexp2/siU", $input2, $matches2, PREG_SET_ORDER)) {
foreach($matches2 as $match2) {
$canti=strip_tags($match2[0]);
$canti2=strlen($canti);
if ($canti2>100) {
echo "Cantidad ".$canti2."<br>";
echo "UNO ".$canti."<br>";
}
}
}
Agradezco cualquier ayuda.
Saludos