¿Cómo puedo sacar el código html de una página?
Es que los estoy guardando en el spider de mi buscador y de momento uso un javascript bastante incómodo.
No sé si tiene algo de relación con la función
get_meta_tags
| ||||
Extraer código html ¿Cómo puedo sacar el código html de una página? Es que los estoy guardando en el spider de mi buscador y de momento uso un javascript bastante incómodo. No sé si tiene algo de relación con la función get_meta_tags
__________________ Regístrate y ten la oportunidad de ganar 500€ (en códigos SMS) |
| |||
get_meta_tags() .. tan solo te leerá las cabeceras del <header> ... </header> Si con eso te "apañas" .. usalas .. Si necesitas recorrer mas HTML de la página antes de nada deberas abrir la página con alguna función tipo fopen() (en modo lectura) y de ahí podrías ir usando expresiones regulares para quedarte solo con el cóntenido de la pagina (sin HTML .. osese, nada que esté entre < y > ...). Una vez "filtrado" ahí veras tú que datos requieres como para poder aplicar mas expresiones regulares u otras funciones. En hotscripts.com tienes muchos buscadores así que hacen este tipo de operaciones .. Repasa sus código. Un saludo,
__________________ Por motivos personales ya no puedo estar con Uds. Fue grato haber compartido todos estos años. Igualmente los seguiré leyendo. |
| ||||
Gracias, miraré haber que encuentro.
__________________ Regístrate y ten la oportunidad de ganar 500€ (en códigos SMS) |
| |||
Por aquí se hablo del tema... http://www.forosdelweb.com/showthrea...hreadid=124439 |
| ||||
Prueba a usar show_source(). Creo que había un comentario interesante en esa función.
__________________ M a l d i t o F r i k i |
| ||||
Muchas gracias ahora me pondré a mirar haber que puedo hacer. Gracias.
__________________ Regístrate y ten la oportunidad de ganar 500€ (en códigos SMS) |