Hola a todos
Estoy desarrollanod un Crawler con java y necesito extraer todas las imagenes de las paginas web que parseo. El crawler que tengo hecho localiza las URL usando el siguiente pedazo de script:
Código:
Pattern p =
Pattern.compile("<a\\s+href\\s*=\\s*\"?(.*?)[\"|>]",
Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(pageContents);
Supongo que para buscar imagenes sera modificar la parte del Pattern.compile("...")
Sabría alguien decirme que linea debo incluir ahi para que me encuentre las imágenes del código HTML que estoy parseando???
Muchas gracias a todos y un saludo