11/02/2013, 11:47
|
| Colaborador | | Fecha de Ingreso: septiembre-2011 Ubicación: Estigia
Mensajes: 1.471
Antigüedad: 13 años, 2 meses Puntos: 397 | |
Respuesta: parsear HTML pero no entodas las pag web es lo mismo ....
Ese si es un problema, porque si el contenido es de un solo sitio web o el contenido son etiquetas especificas (og tags, meta tags, etc.) no seria tan complejo, ya que con expresiones regulares se soluciona fácilmente eso.
El asunto es que deben haber parámetros fijos que TODAS las paginas deberían tener, parámetros que debes de definir en base a lo que quieres lograr, no se, etiquetas especificas, estructuras definidas etc.
Obtendrías el contenido del documento, y bajo esos parámetros y expresiones regulares obtendrías lo que deseas, esa seria la idea base
Saludos |