Estoy desarrollando un Crawler para una practica de la uni y necesito que me encuentre imagenes en la URL que parsea. Para ello habia pensado usar las Expresiones Regulares de Java.
Dentro del Crawler ya tengo desarrollado un scrip que te encuentra URLs dentro del HTML parseado:
Código:
Por lo que supongo que tan sólo será modificar la Expresion regular contenida en compile("")Pattern p = Pattern.compile("<a\\s+href\\s*=\\s*\"?(.*?)[\"|>]", Pattern.CASE_INSENSITIVE); Matcher m = p.matcher(pageContents);
Si alguien pudiera decirme que expresion regular hay que escribir, o redireccionarme a algun manual online donde yo mismo pueda aversiguarlo se lo agredacería muchisimo.
Un saludo a todos