Estoy tratando de extraer los links de un feed con preg_match_all (no pude parsear con simplexml_load_file por el desorden) y resulta que lo que necesito es solamente extraer los links que comiencen con una url determinada.
Ejemplo:
http://juanito.perez.com/solucion/ayuda?1.php
http://juanito.perez.com/consultas/consultas?44.php
http://otraweb.com/problema/ayuda?23.php
extraer solo urls que comiencen por "http://juanito.perez.com/solucion/"... en este caso el output sería: http://juanito.perez.com/solucion/ayuda?1.php
Sé que necesito depurar el patron del script de abajo pero aún no doy con el indicado..
Código PHP:
<?php
// retrieve link destinations
function get_a_href($file){
$h1count = preg_match_all('/(href=")(.*?)(")/i',$file,$patterns); // depurar el patron
return $patterns[2];
}
$file = file_get_contents("http://juanito.perez.com/");
$x = (get_a_href($file));
print_r($x);
?>
Gracias!!