Estoy desarrollanod un Crawler con java y necesito extraer todas las imagenes de las paginas web que parseo. El crawler que tengo hecho localiza las URL usando el siguiente pedazo de script:
Código:
Supongo que para buscar imagenes sera modificar la parte del Pattern.compile("...")Pattern p = Pattern.compile("<a\\s+href\\s*=\\s*\"?(.*?)[\"|>]", Pattern.CASE_INSENSITIVE); Matcher m = p.matcher(pageContents);
Sabría alguien decirme que linea debo incluir ahi para que me encuentre las imágenes del código HTML que estoy parseando???
Muchas gracias a todos y un saludo