Wget problema 403

ploki · #1 (**permalink**) 10/03/2012, 18:37

Hola, estoy intentando coger unos documentos de un directorio y estoy utilizando wget pero tengo el siguiente problema.

Yo tengo una url del estilo
http://www.pagina.es/ruta1/ruta2/archivos.pdf

Se que hay un pdf en http://www.pagina.es/ruta1/ruta2/ porque me lo he descargado, pero yo quiero sacar todos los que haya en el directorio. Estoy lanzando

wget -r -l1 --no-parent -A.pdf http://www.pagina.es/ruta1/ruta2/

pero al no haber un index en esa carpeta, no me busca de forma recursiva, sólo me devuelve un 403.

¿Alguna idea para sacar todos los pdfs de una ruta web?

Gracias por adelantado

ploki · #2 (**permalink**) 11/03/2012, 06:35

También lo he intentado con
wget http://www.pagina.es/ruta1/ruta2/*.pdf pero nada, el mismo 403

A lo mejor con el wget no es la manera de hacerlo. Si alguien conociera otra manera por favor que me lo diga

#3 (**permalink**) 12/03/2012, 08:59

No es posible, por la forma en la que funciona HTTP (nada que ver en realidad con UNIX o Linux). Solamente se puede obtener archivos cuyo nombre se conoce. Si querés obtener de forma recursiva todos los archivos de una carpeta, tendrás que tener un índice.

Saludos.