Foros del Web » Estrategias Digitales y Negocios Online » SEO »

Robots.txt, no indexar carpeta y su contenido.

Estas en el tema de Robots.txt, no indexar carpeta y su contenido. en el foro de SEO en Foros del Web. Foros del Web...
  #1 (permalink)  
Antiguo 10/02/2009, 13:55
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Robots.txt, no indexar carpeta y su contenido.

Foros del Web

Última edición por Usuarios466; 30/06/2015 a las 12:45
  #2 (permalink)  
Antiguo 10/02/2009, 14:18
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 9 meses
Puntos: 2114
Respuesta: Robots.txt, no indexar carpeta y su contenido.

Con tu ejemplo, estás restringiendo el acceso a toda la carpeta.
Ese uso es el correcto.

Para un ejemplo más.
Supónte que en dicha carpeta, convivan en el mismo nivel imágenes JPG y archivos HTML.
Vamos... es un ejemplo.
Y que en tu caso no te preocupase que el bot indexara las imágenes, pero sí los documentos HTML.
Entonces, para ello, utilizás un comodín que le diga: "no rastree los documentos HTML".

El ejemplo es así:

Código txt:
Ver original
  1. User-agent: *
  2. Disallow: /carpeta_ejemplo/*.html
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #3 (permalink)  
Antiguo 10/02/2009, 14:28
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Robots.txt, no indexar carpeta y su contenido.

Ok, es bueno saberlo para otra ocasión, pero en la carpeta que te comento, sólo conviven archivos html.
Una última cosa, el ejemplo que yo he puesto es el correcto al 100%? Es decir, después de "Disallow: /carpeta_ejemplo/", ¿no hay que poner un * para que se sepa que es todo? ¿O da lo mismo si lo pongo o no?

Última edición por Usuarios466; 22/02/2012 a las 07:45
  #4 (permalink)  
Antiguo 10/02/2009, 14:35
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 9 meses
Puntos: 2114
Respuesta: Robots.txt, no indexar carpeta y su contenido.

Cita:
Iniciado por Daniel Ulczyk Ver Mensaje
Con tu ejemplo, estás restringiendo el acceso a toda la carpeta.
Ese uso es el correcto.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #5 (permalink)  
Antiguo 10/02/2009, 15:52
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Robots.txt, no indexar carpeta y su contenido.

Pese a que, como digo, ya no existe esa carpeta porque la eliminé, el Googlebot la sigue rastreando (pese a que en toda mi web, no hay ningún enlace que haga referencia a la carpeta eliminada). ¿Sirve ponerlo en el robots.txt la carpeta del ejemplo si ya no existe para que no la siga rastreando/indexando?

Última edición por Usuarios466; 22/02/2012 a las 07:45
  #6 (permalink)  
Antiguo 10/02/2009, 16:11
Avatar de Adsl5mb  
Fecha de Ingreso: junio-2007
Mensajes: 1.589
Antigüedad: 17 años, 5 meses
Puntos: 34
Respuesta: Robots.txt, no indexar carpeta y su contenido.

Si al acceder a esa página da error 404 con el correspondiente header entonces Google cuando pase nuevamente la va a tener que quitar del indice.
__________________
Foro: Yelsoft
Blog: Milutilidades
  #7 (permalink)  
Antiguo 11/02/2009, 04:15
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 9 meses
Puntos: 2114
Respuesta: Robots.txt, no indexar carpeta y su contenido.

Cita:
Iniciado por Juan Ca Ver Mensaje
¿Sirve ponerlo en el robots.txt la carpeta del ejemplo si ya no existe para que no la siga rastreando/indexando?
Qué sentido tiene dejar una directiva para una URL que no existe ya?


Como bien te dice *Adsl5mb* cuando GoogleBot obtenga un nuevo 404, la quitará de sus índices (si es que no lo ha hecho todavía).
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 11:38.