Hola a todos,
Estoy haciendo una práctica en la facultad que consiste en crear un generador de mapas de web sites.
Primero intenté extraer los enlaces usando una expresión regular, pero a la hora de intentar sacarlos en determinadas páginas, el programa se quedaba colgado. Cambié la expresión regular y con la nueva no se quedaba colgado, pero en cambio no me cogía todos los enlaces. Así que desistí de usar expresiones regulares.
Así que he probado usando la clase HTMLEditorKit, pero como mucho sólo puedo obtener las direcciones URL de los enlaces, pero no sé cómo obtener el título de los mismos, que es otra cosa que también me interesa.
Entonces... ¿sabéis alguna forma de cómo podría extraer la dirección y el título de los enlaces cuando los extraigo?
Muchas gracias a todos!
Aether