Basicamente es leer el contenido de la web (con file_get_contents u otra funcion que te lo permita) y acto seguido parsear el codigo fuente buscando lo que necesitas y borrando el resto. Para filtrar el codigo fuente me parece qu ees casi imprescindible que uses expresiones regulares.
Solo por poner un ejemplo, deseo todos los textos que aparecen en negritas en una pagina:
Código PHP:
<pre>
<?php
$html = file_get_contents("http://www.google.com/search?hl=es&q=texto&btnG=Buscar+con+Google&lr=");
preg_match_all("/<b>.*?<\/b>/", $html, $coincidencias);
print_r($coincidencias);
?>
</pre>
Saludos