Buenas tardes,
Estoy haciendo una web que incluye un sistema de clasificación de enlaces. Quiero que la gente incluya la url y el sistema solo añada el title y el primer parrafo del texto de la noticia para luego poner un "leer más" que le lleve a la web en cuestión.
El title es facil obtenerlo pues siempre va entre las etiquetas <title> lo que no tengo ni idea de como obtener es el texto principal de la noticia, ya que en el body de una web hay muchísimas cosas.
Los que useis Facebook y hayais pegado un link en vuestro muro sabréis a lo que me refiero. Con Facebook publiques el link que sea, a cualquier tipo de web, sus sistema extrae siempre el texto de la noticia, no se confunde, no saca el texto que puede ir en una de las columnas de la web, en el pie de página...
Alguien se hace una idea de como se puede filtrar el html de una pagina para aislar el texto principal de esta? Muchisimas gracias.