Tal vez lo que te hace falta especificar es si lo que quieres obtener es el HTML/etc generado tras una petición a una página tipo
http://www.tal.ta/nose.tal .. o realmente el "código fuente" de ese -por ejemplo- nose.php (con sus <? .. código php ?> y demás)
Si quieres "parsear" lo que resulta de la ejecución de una página (sea .html .. .php .asp .jsp .pl .. o lo que sea) .. puedes usar el control del buffer de PHP para leer tu página (insisto: el resultado) hacia una variable .. que posteriormente tu trabajaras como una "cadena" mas para "parsearla".
Código PHP:
<?
ob_start();
readfile("el URL de la pagina");
$html=ob_get_contets()
ob_end_flush();
// y con tu $html .. ya lo procesas como un string cualquiera.
?>
Un saludo,