@zero, al principio en la parte de introducción, doy varias observaciones cuál se debe usar. La que en varios tutorial que lei antes de postear y aún sigo verificando indican que la mejor es cURL por lo robusta que es. Hay varias ténicas, que muestro en varios post, de como limitar la consulta a que sea por bytes o por tiempo que te pueden ayudar a mejorar la búsqueda.
Ahora, para manejarte en un HTML para buscar algo en específico, lo mejor es usar SimpleXML o DOM. Si lo quieres para otra cosa, puedes usar cURL o file_get_contents. Cualquier duda me dejas saber