Hola, estoy renegando con las Expresiones Regulares que me cuestan horrores.
resulta que quiero hacer un patron que me permita extraer el párrafo entero que contiene determinada palabra (por ej: "albahaca") dentro de una cadena html.
Estuve probando varias formas y no me encuentra nada :(
También quería saber cómo poder extraer por ej. 10 palabras antes y 10 palabras después de la palabra buscada.
Les copio mis intentos fallidos a ver si alguien me puede ayudar. Una aclaración, estoy tratando de encontrar un párrafo delimitado por "<br>" o por "<p></p>" o por "<br>y el fin de la cadena, les aclaro eso para que se entienda lo que quise hacer. Tal vez esté mal pensado esa forma de delimitar.
Un abrazo y gracias!
//Intento 1:
$patron_parrafo = "(^(<br>)(albahaca)(<br>)$) | (^(<p>)(albahaca)(</p>)$) | (^(<br>)(albahaca)(\Z)$)";
//Intento 2 (sólo delimité por <br>):
$patron_parrafo = "((^<br>)([:alnum:]|[:alpha:]|[:blank:])?(albahaca)+([:alnum:]|[:alpha:]|[:blank:])?(<br>)$)";
$texto1 = "Ocimum basilicum), de la familia de las lamiáceas, es una hierba aromática anual de crecimiento bajo (entre 40-60 cm) con hojas de un verde lustroso, ovales u ovadas, dentadas y de textura sedosa. Emite espigas florales terminales, con flores tubulares de color blanco o violáceo.<br>
La albahaca es una planta es muy sensible a las heladas. Se cultiva únicamente por semillas, que se pueden sembrar en semilleros o macetas en un invernadero a principios o mediados de la primavera. Requiere una posición soleada, aunque en climas de veranos muy calurosos agradece algo de sombra y suelos fértiles, permeables y húmedos.<br>";
$texto2 = "<p>La <b>albahaca</b> (<i><b>Ocimum basilicum</b></i>), de la familia de las <a href=\"/wiki/Lamiaceae\" title=\"Lamiaceae\">lamiáceas</a>, es una <a href=\"/wiki/Hierba\" title=\"Hierba\">hierba</a> aromática anual de crecimiento bajo (entre 40-60 cm) con <a href=\"/wiki/Hoja\" title=\"Hoja\">hojas</a> de un verde lustroso, ovales u ovadas, dentadas y de textura sedosa. Emite espigas <a href=\"/wiki/Flor\" title=\"Flor\">florales</a> terminales, con flores tubulares de color blanco o violáceo.</p>
<p>Esta planta es muy sensible a las heladas. Se cultiva únicamente por <a href=\"/wiki/Semilla\" title=\"Semilla\">semillas</a>, que se pueden sembrar en semilleros o macetas en un <a href=\"/wiki/Invernadero\" title=\"Invernadero\">invernadero</a> a principios o mediados de la primavera. Requiere una posición soleada, aunque en climas de veranos muy calurosos agradece algo de sombra y suelos fértiles, permeables y húmedos.</p>
<table id=\"toc\" class=\"toc\" summary=\"Tabla de contenidos\">";
$busca_parrafo1 = eregi($patron_parrafo, $texto1, $matriz3);
$busca_parrafo2 = eregi($patron_parrafo, $texto2, $matriz4);
echo "Parrafo en texto1<br>";
for ($x=1; $x<(count($matriz3)); $x++) {
echo "Encontré: ".$matriz3[$x]."<br>";
}
echo "<br><br>";
echo "Parrafo en texto2<br>";
for ($x=1; $x<(count($matriz4)); $x++) {
echo "Encontré: ".$matriz4[$x]."<br>";
}
echo "<br><br>";