Buenas
Alguien sabe algún programa o código (spider, robot) para indexar webs en una base de datos sql, y que se pueda configurar en todos los parámetros. para indixe los campos igual que en una BBDD de sql.
Gracias.
| |||
Spider Programa Buenas Alguien sabe algún programa o código (spider, robot) para indexar webs en una base de datos sql, y que se pueda configurar en todos los parámetros. para indixe los campos igual que en una BBDD de sql. Gracias. |
| |||
Eso se hace con fopen("archivo.html", "r"); Despues lo recorres e imprimes el numero de linea y lo puedes guardar en la Base de datos, especial para tomar el valor del dolar etc. Atte. Ruben Ricarte. |
| |||
mm bueno .. rubenije .. No es tan simple el funcionamiento de un spider .. Sí, una parte es "abrir" el archivo .. pero lo que hace el "spider" es abrir dicho archivo (código HTML/fuente) en busca (vía expresiones regulares) de tag's tipo links (<a href ...>) para ir creando la BD de páginas que habrá que ir a abrir ... Otro proceso es filtrar todo código HTML/etc (más expresiones regulares) para quedarse con el auténtico contenido de la página y de ahí empezar a ver palabras claves (las que más se repitan) para ir creando el diccionario/index . Lo mejor es ver como trabajan este tipo de aplicaciones .. Puedes verlas por aquí: http://www.hotscripts.com/PHP/Script...rch/index.html http://www.hotscripts.com/PHP/Script...ing/index.html Un saludo, |
| |||
valla no funciona ninguno de los dos links....
__________________ http://www.umtsclub.com Moviles 3G y todo sobre nuevas tecnologias moviles |