La forma más sencilla de obtener el HTML de otra página es usando file_get_contents.
No es la forma más rápida, sin embargo, ni la más eficiente. Si querés rapidez y eficiencia mejor investigá las
funciones cURL.
Luego, para obtener lo que quieras de la página, lo mejor es usar expresiones regulares. ¿sabés lo que son? si no lo sabés, te recomiendo que lo investigues. En este mismo foro se han discutido antes formas de obtener todos los enlaces de una página, buscalo.
En mi blog tengo un mini
tutorial de expresiones regulares, y me servirían comentarios de alguien que empiece en el tema
Saludos.