Foros del Web » Administración de Sistemas » Unix / Linux »

Wget problema 403

Estas en el tema de Wget problema 403 en el foro de Unix / Linux en Foros del Web. Hola, estoy intentando coger unos documentos de un directorio y estoy utilizando wget pero tengo el siguiente problema. Yo tengo una url del estilo http://www.pagina.es/ruta1/ruta2/archivos.pdf ...
  #1 (permalink)  
Antiguo 10/03/2012, 18:37
 
Fecha de Ingreso: mayo-2009
Mensajes: 18
Antigüedad: 15 años, 6 meses
Puntos: 0
Wget problema 403

Hola, estoy intentando coger unos documentos de un directorio y estoy utilizando wget pero tengo el siguiente problema.

Yo tengo una url del estilo
http://www.pagina.es/ruta1/ruta2/archivos.pdf

Se que hay un pdf en http://www.pagina.es/ruta1/ruta2/ porque me lo he descargado, pero yo quiero sacar todos los que haya en el directorio. Estoy lanzando

wget -r -l1 --no-parent -A.pdf http://www.pagina.es/ruta1/ruta2/

pero al no haber un index en esa carpeta, no me busca de forma recursiva, sólo me devuelve un 403.

¿Alguna idea para sacar todos los pdfs de una ruta web?

Gracias por adelantado
  #2 (permalink)  
Antiguo 11/03/2012, 06:35
 
Fecha de Ingreso: mayo-2009
Mensajes: 18
Antigüedad: 15 años, 6 meses
Puntos: 0
Respuesta: Wget problema 403

También lo he intentado con
wget http://www.pagina.es/ruta1/ruta2/*.pdf pero nada, el mismo 403

A lo mejor con el wget no es la manera de hacerlo. Si alguien conociera otra manera por favor que me lo diga
  #3 (permalink)  
Antiguo 12/03/2012, 08:59
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Wget problema 403

No es posible, por la forma en la que funciona HTTP (nada que ver en realidad con UNIX o Linux). Solamente se puede obtener archivos cuyo nombre se conoce. Si querés obtener de forma recursiva todos los archivos de una carpeta, tendrás que tener un índice.


Saludos.

Etiquetas: 403, wget
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 11:30.