htmlsql es el nombre de esta clase.
Su utilidad es la de extraer contenido de páginas web mediante consultas en lenguaje sql, muy simple de usar y muy útil.
El link me lo pasó Metacortex, yo solo lo pongo acá como aporte.
Info en Inglés
Info en español
Saludos.