Buenas estoy intentando verificar si el texto de un documento dado contiene ciertas palabras clave utilizando la siguiente funcion (aclaro q uso mootools):
test=function(args)
{
found=false;
idx=0;
while(!found && idx!=-1)
{
idx=args.tags.indexOf(' ',idx);
if(idx!=-1)
{
tag=args.tags.substr(0,idx);
args.tags=args.tags.substr(idx+1,args.tags.length-1).trim();
}else tag =args.tags;
alert("tag="+tag);
rgex=new RegExp('>?[^<]*'+tag); //expresion regular
found=rgex.test(args.text);
if(found){ alert("match"); return true};
}
return found;
}
la funcion ercibe un objeto args descripto continuacion:
args.tags=[string] palabras clave para la busqueda separadas por whitespace
args.text=[string] texto en el que se realiza la busqueda
la funcion devuelve true solo si algua de las etiquetas 'tags' coincide con el texto 'text'.
el problema es q el texto 'text' puede contener etiquetas de html, asi q deseo matchear los 'tags' de busqueda solamente con las partes del texto
que no forma parte del codigo html, es decir solo con lo q es visible al usuario.
Lo q necesito es una expresion regular (y la explicacion del caso si es posible) que funcione a estos efectos como se muestra en la funcion.
desde ya gracias.