| |||
parsear HTML hola a todos tengo el siguientes problema y es q kiero parsear cualquier pagina html pero solo obtener el texto q sea de mi interes y la cuestion es q cada pagina web tiene una ocnfiguracion diferente y entonces no se como hacer eso porque no existe como tal un patron he pensado en un algoritmo por la busqueda de palabras claves pero se me hace muy engorroso si pudierna ayudarme por fa es mi tesis!!! |
| ||||
Respuesta: parsear HTML Hola explica mejor esta parte Saludos
__________________ Haz preguntas inteligentes-Como ser Hacker No hacer preguntas por mensaje privado. No sólo no es inteligente sino que es egoísta. |
| |||
Respuesta: parsear HTML ssi mira cuando me refiereo al texto de mi interes es el texto q yo kiera por ejemplo cuando entras a una pagina de noticias y entras a una noticia la pagina web no es solo la noticia sino tiene tambien links q eso es texto tambien y abajo espacios para comentar no yo no quiero nada mas que el texto referente a la noticia q eso eta contenido dentro de alguna etiqueta pero no entodas las pag web es lo mismo me entiendes?? |
| ||||
Respuesta: parsear HTML pero no entodas las pag web es lo mismo .... Ese si es un problema, porque si el contenido es de un solo sitio web o el contenido son etiquetas especificas (og tags, meta tags, etc.) no seria tan complejo, ya que con expresiones regulares se soluciona fácilmente eso. El asunto es que deben haber parámetros fijos que TODAS las paginas deberían tener, parámetros que debes de definir en base a lo que quieres lograr, no se, etiquetas especificas, estructuras definidas etc. Obtendrías el contenido del documento, y bajo esos parámetros y expresiones regulares obtendrías lo que deseas, esa seria la idea base Saludos
__________________ Haz preguntas inteligentes-Como ser Hacker No hacer preguntas por mensaje privado. No sólo no es inteligente sino que es egoísta. |
| |||
Respuesta: parsear HTML que crees de usar un algoritmo que mediante la identificacion de palabras claves extraiga la parte que quiero del texto de auerdo a la coincidencia,conoces de alguno? o de alguna herramienta que haga esto..de veras lo necesito..muchas gracias por la respuesta anterior...saludos |
| ||||
Respuesta: parsear HTML Pues en si esa es la idea, yo lo vería como una clase que se encargue de ello, herramientas para ello las desconozco pero como tal pueden haber Saludos
__________________ Haz preguntas inteligentes-Como ser Hacker No hacer preguntas por mensaje privado. No sólo no es inteligente sino que es egoísta. |
Etiquetas: |