Extraer código html

yampoo · #1 (**permalink**) 21/04/2003, 12:36

¿Cómo puedo sacar el código html de una página?

Es que los estoy guardando en el spider de mi buscador y de momento uso un javascript bastante incómodo.

No sé si tiene algo de relación con la función

get_meta_tags

Cluster · #2 (**permalink**) 21/04/2003, 12:58

get_meta_tags() .. tan solo te leerá las cabeceras del <header> ... </header>

Si con eso te "apañas" .. usalas .. Si necesitas recorrer mas HTML de la página antes de nada deberas abrir la página con alguna función tipo fopen() (en modo lectura) y de ahí podrías ir usando expresiones regulares para quedarte solo con el cóntenido de la pagina (sin HTML .. osese, nada que esté entre < y > ...).
Una vez "filtrado" ahí veras tú que datos requieres como para poder aplicar mas expresiones regulares u otras funciones.

En hotscripts.com tienes muchos buscadores así que hacen este tipo de operaciones .. Repasa sus código.

Un saludo,

yampoo · #3 (**permalink**) 21/04/2003, 13:09

Gracias, miraré haber que encuentro.

fran86 · #4 (**permalink**) 21/04/2003, 17:34

Por aquí se hablo del tema...
http://www.forosdelweb.com/showthrea...hreadid=124439

Cain · #5 (**permalink**) 22/04/2003, 03:14

Prueba a usar show_source(). Creo que había un comentario interesante en esa función.

yampoo · #6 (**permalink**) 22/04/2003, 10:34

Muchas gracias ahora me pondré a mirar haber que puedo hacer.

Gracias.