Las expresiones regulares te buscan y te pueden devolver el trozo de cadena que han encontrado. Echa un ojo al segundo apartado de
http://chuwiki.chuidiang.org/index.p...ulares_en_Java o al ejemplo que te puse antes de href, además de buscarlos, extrae las url correspondientes. En este trozo de código
Código java:
Ver original// Se busca href por el texto html
Pattern pHref = Pattern
.compile("[hH][rR][eE][fF] *= *[\"']?([^ \"'>]*)[\"'>]");
Matcher mHref = pHref.matcher(textoHtml);
// Para cada href encontrado
while (mHref.find()) {
// se convierte en url absoluta
String href
= convierteHrefRelativaEnAbsoluta
(urlDescompuesta,
mHref.group(1));
enlaces.add(href.replace("\\", "/"));
}
return enlaces;
el bucle mHref.find() va buscando las cadenas href="...." y extrayendo su contenido con mHref.group(1).
Se bueno.