Hola, despues de buscar un rato largo en internet decidi prguntar en forosdelweb. Lo que necesito hacer es buscar links en el codigo fuente de X url. A esto se lo conoce como link extractor. Hasta acá todo bien. Ahora mi duda viene a rais de que de esta forma solo consigo los links que figuran en <a href= pero yo necesito trambien extraer aquellos que estan escritos pero sin un link. Es decir extraer aquellas palabras que comienzan con "http://". Una vez obtenido esto tambien quiero filtrar los resultados, es decir que de los links extraidos solo liste los de determinados host.
Se que estoy pidiendo mucho, pero con solo una orientacion me las rebuscaré. Es que estoy muy perdido y de esta forma no puedo usar google.
Desde ya muchas gracias.