Foros del Web » Estrategias Digitales y Negocios Online » SEO »

Duda con archivo robot.txt

Estas en el tema de Duda con archivo robot.txt en el foro de SEO en Foros del Web. Hola queria saber si el siguiente parametro sirve para excluir de la busqueda el contenido de la carpeta img y los subdirectorios que esta contenga. ...
  #1 (permalink)  
Antiguo 18/09/2011, 21:33
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Duda con archivo robot.txt

Hola queria saber si el siguiente parametro sirve para excluir de la busqueda el contenido de la carpeta img y los subdirectorios que esta contenga.

Cita:
Disallow:/img/*

Otra duda es que si en mi pagina enlazo imagenes que estan en esa carpeta "img" en el buscador de imagenes de google van a aparecer?.

Porque mi problema actual es que me indexa las imagenes pero una vez que entro me muestra la imagen pero del directorio donde se encuentra alojada

Este es un ejemplo, y lo que yo quiero es que aparesca de fondo el post donde enlazo dicha imagen
__________________
Los mejores juegos de PC gratis en ******
  #2 (permalink)  
Antiguo 19/09/2011, 01:36
Avatar de Emirodgar  
Fecha de Ingreso: junio-2008
Mensajes: 1.255
Antigüedad: 16 años, 5 meses
Puntos: 121
Respuesta: Duda con archivo robot.txt

Si no permites la indexación de imágenes, aunque las incluyas en tus artículos, no serán indexadas por los buscadores.

Lo mejor que puedes hacer con ellas es permitir su indexación, de esa forma, seguro que consigues mayor tráfico (aunque no sea de gran calidad).

Con esa intrsucción si, deshabilitas el acceso a esa carpeta y a los subdirectorios que contenga, no obstante, desde webmasters tools puedes generar un archivo robots.txt mediante un formulario muy sencillo, así te asegurarás de que tu fichero es correcto y que hace exactamente lo que tu quieres que haga.
__________________
Sígueme en Twitter @Emirodgar | Diseño web Salamanca |¿Necesitas humor ?
  #3 (permalink)  
Antiguo 19/09/2011, 09:53
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Respuesta: Duda con archivo robot.txt

Ah ok, pero que instruccion puedo hacer para que deshabilite el directorio pero no los archivos qe contenga
__________________
Los mejores juegos de PC gratis en ******
  #4 (permalink)  
Antiguo 19/09/2011, 11:19
Avatar de Tedel  
Fecha de Ingreso: enero-2011
Ubicación: Lima
Mensajes: 2.744
Antigüedad: 13 años, 10 meses
Puntos: 444
Respuesta: Duda con archivo robot.txt

No puedes hacer eso. debes guardar los archivos que te interesa prohibir en otras carpeta.

Y, dicho sea de paso, la instrucción que anotaste primero no es correcta.
__________________
Soy el autor de Heptagrama y tengo un servicio "todo incluido" de marketing web.
  #5 (permalink)  
Antiguo 19/09/2011, 12:06
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Respuesta: Duda con archivo robot.txt

Hu pero si yo quiero bloquear el directorio y no los archivos, eso no es posible? porq si lo pongo en otra carpeta estamos en la misma
__________________
Los mejores juegos de PC gratis en ******
  #6 (permalink)  
Antiguo 19/09/2011, 16:47
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 19 años
Puntos: 2053
Respuesta: Duda con archivo robot.txt

Explico una solución fácil para evitarlo. Creo un archivo index.php en la carpeta que redireccione hacia la página del sitio dónde aparece la imagen o hacia donde quieras.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #7 (permalink)  
Antiguo 20/09/2011, 21:44
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Respuesta: Duda con archivo robot.txt

creo q mas facil seria bloquear el directorio desde el archivo htacces
__________________
Los mejores juegos de PC gratis en ******
  #8 (permalink)  
Antiguo 21/09/2011, 12:45
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 19 años
Puntos: 2053
Respuesta: Duda con archivo robot.txt

Si bloqueas desde el archivo .htaccess bloqueas todo el contenido.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #9 (permalink)  
Antiguo 21/09/2011, 13:58
Avatar de Tedel  
Fecha de Ingreso: enero-2011
Ubicación: Lima
Mensajes: 2.744
Antigüedad: 13 años, 10 meses
Puntos: 444
Respuesta: Duda con archivo robot.txt

Yo creo que te estás complicando por nada. Cuando Google pase por tu web otra vez, debería notar los cambios.
__________________
Soy el autor de Heptagrama y tengo un servicio "todo incluido" de marketing web.
  #10 (permalink)  
Antiguo 21/09/2011, 16:24
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Respuesta: Duda con archivo robot.txt

Claro tienes razon, bloqueo todo. Queda esperar a que google pase devuelta como dijo Tedel, porque poner un archivo en cada carpeta para que redireccione es mucho trabajo, tiene que haber una solucion mas sencilla.
__________________
Los mejores juegos de PC gratis en ******
  #11 (permalink)  
Antiguo 22/09/2011, 00:38
Usuario no validado
 
Fecha de Ingreso: mayo-2011
Mensajes: 1.231
Antigüedad: 13 años, 6 meses
Puntos: 228
Respuesta: Duda con archivo robot.txt

Cita:
Iniciado por hackcrack Ver Mensaje
Hola queria saber si el siguiente parametro sirve para excluir de la busqueda el contenido de la carpeta img y los subdirectorios que esta contenga.




Otra duda es que si en mi pagina enlazo imagenes que estan en esa carpeta "img" en el buscador de imagenes de google van a aparecer?.

Porque mi problema actual es que me indexa las imagenes pero una vez que entro me muestra la imagen pero del directorio donde se encuentra alojada

Este es un ejemplo, y lo que yo quiero es que aparesca de fondo el post donde enlazo dicha imagen

Puedes poner esto en tu robos.txt:

User-agent:*
Disallow:/*img*
Disallow:/images/

Si le prohibes la entrada a tu folder de imagenes (o cambia el nombre de la carpeta si no es images)

Esto en teoria deberia funcionar

Saludos
  #12 (permalink)  
Antiguo 22/09/2011, 14:00
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Respuesta: Duda con archivo robot.txt

Pero merino_renato, eso no desindexaria tambien las imagenes que contenga la carpeta?
__________________
Los mejores juegos de PC gratis en ******
  #13 (permalink)  
Antiguo 22/09/2011, 16:20
Avatar de Tedel  
Fecha de Ingreso: enero-2011
Ubicación: Lima
Mensajes: 2.744
Antigüedad: 13 años, 10 meses
Puntos: 444
Respuesta: Duda con archivo robot.txt

Cita:
Iniciado por hackcrack Ver Mensaje
Pero merino_renato, eso no desindexaria tambien las imagenes que contenga la carpeta?
No las saca del índice. Solo evita que los robots vuelvan a pasar por ahí.

La salida final del índice se da cuando los buscadores sea purgado de los datos inexistentes... eso no es an frecuente, en realidad.
__________________
Soy el autor de Heptagrama y tengo un servicio "todo incluido" de marketing web.
  #14 (permalink)  
Antiguo 22/09/2011, 16:49
Avatar de metafrases  
Fecha de Ingreso: agosto-2011
Mensajes: 60
Antigüedad: 13 años, 3 meses
Puntos: 11
Respuesta: Duda con archivo robot.txt

Yo lo que haría de momento sería añadir un archivo index.html vacio en cada uno de los directorios (img, entradas, juegos, 24) para no dejar visible la lista de archivos incluidos en esas carpetas. Según tengo entendido, dejar los directorios como los tienes supone un fallo de seguridad.
__________________
»»««
  #15 (permalink)  
Antiguo 22/09/2011, 18:32
Usuario no validado
 
Fecha de Ingreso: mayo-2011
Mensajes: 1.231
Antigüedad: 13 años, 6 meses
Puntos: 228
Respuesta: Duda con archivo robot.txt

Cita:
Iniciado por metafrases Ver Mensaje
Yo lo que haría de momento sería añadir un archivo index.html vacio en cada uno de los directorios (img, entradas, juegos, 24) para no dejar visible la lista de archivos incluidos en esas carpetas. Según tengo entendido, dejar los directorios como los tienes supone un fallo de seguridad.
?????????????

A que te refieres a poner:

User-agent:*
Disallow:/*img*
Disallow:/images/


Cual fallo de seguridad te refieres?

Esto solo le dice al crawler: no entres a la carpeta imagenes ni rastrees nigun archivo que tenga img ...

No entiendo para que poner el index en cada carpeta, lo podrias explicar?

Yo no uso mas que el Disallow:/images/

el

Disallow:/*img*

lo que hace es que el crawler no lea imagenes pero en mi web si quiero que las lea, si queremos que si las lea pero que no indexe TODA la carpeta donde guardas las imagenes, podemos solo bloquear asi:

User-agent:*
Disallow:/images/


Yo lo he puesto asi y mi web se ve perfecto y cuando consulto en el buscador de google:

site:www.webejemplo.com

Me muestra exactamente lo que google tiene indexado de mi web si se me escurre alguna web la puedo borrar en herramientas para webmasters de google copiando la URL despues del:

www.webejemplo.com/imagenes/loquesea.com

pero además puedes bloquear la url en tu robots.txt asi:

User-agent:*
Disallow:/images/
Disallow:/imagenes/loquesea.com

y la url debe devolver una pagina 404 y listo se borra cualquier pagina que ya estaba indexada en google y que quieras borrar, si es una web que no desees que se indexe le pones <meta name="ROBOTS" content="noindex,nofollow" /> en la etiqueta <head> y listo...

A mi si me funciona asi...

Saludos

Última edición por Daniel Ulczyk; 22/09/2011 a las 18:50 Razón: se remueve URL del enlace - error 404
  #16 (permalink)  
Antiguo 23/09/2011, 03:15
Avatar de metafrases  
Fecha de Ingreso: agosto-2011
Mensajes: 60
Antigüedad: 13 años, 3 meses
Puntos: 11
Respuesta: Duda con archivo robot.txt

merino_renato, perdona si me he expresado mal. No me refería a tu respuesta.

Con lo que dices estoy de acuerdo, aunque creo que lo que quiere hackcrack es que cuando se indexe una imagen, aparezca de fondo la url donde está ubicada dicha imagen y no el directorio con la lista de archivos que es lo que sucede ahora.

Yo sólo le hacia una apreciación a hackcrack, y le indicaba que se recomienda en aquellos directorios donde se ubican las imagenes o archivos js, etc.. poner un index.html vacio para que no se tenga acceso en la red a dicho listado de archivos.

Es decir, para no liar más la cosa... que no es recomendable ver esta imagen en la red con el listado de archivos accesible a todo el mundo(a nadie le interesa el listado de archivos que tengo en una u otra carpeta en mi servidor):



Simplemente para evitar esto, le comentaba a hackcrack que incluyera en cada uno de estos directorios un index.html vacio, y asi evitar el mostrar mas información que la necesaria.

Simplemente esa puntualización....
__________________
»»««
  #17 (permalink)  
Antiguo 23/09/2011, 06:47
Usuario no validado
 
Fecha de Ingreso: mayo-2011
Mensajes: 1.231
Antigüedad: 13 años, 6 meses
Puntos: 228
Respuesta: Duda con archivo robot.txt

Cita:
Iniciado por metafrases Ver Mensaje
merino_renato, perdona si me he expresado mal. No me refería a tu respuesta.

Con lo que dices estoy de acuerdo, aunque creo que lo que quiere hackcrack es que cuando se indexe una imagen, aparezca de fondo la url donde está ubicada dicha imagen y no el directorio con la lista de archivos que es lo que sucede ahora.

Yo sólo le hacia una apreciación a hackcrack, y le indicaba que se recomienda en aquellos directorios donde se ubican las imagenes o archivos js, etc.. poner un index.html vacio para que no se tenga acceso en la red a dicho listado de archivos.

Es decir, para no liar más la cosa... que no es recomendable ver esta imagen en la red con el listado de archivos accesible a todo el mundo(a nadie le interesa el listado de archivos que tengo en una u otra carpeta en mi servidor):



Simplemente para evitar esto, le comentaba a hackcrack que incluyera en cada uno de estos directorios un index.html vacio, y asi evitar el mostrar mas información que la necesaria.

Simplemente esa puntualización....
Muchas gracias por la alcaracion, si no creas que yo se mucho solo que tiene poco tiempo que yo ressolvi eso tambien, jaja, pero la verdad no te entendia que eera eso de vulnerar la seguridad de nuestra web,uff, menos mal porque ya me habia espantado, a mi tambien en un principio me indexaba tod el google bot, pero despues aprendi a bloquear las url y a pedir que las elimnen desde google webmaster tools y pues ahora ya no pasa, nada.

Pero eso de poner un html vacio no me la sabia... pero bueno pues diario aprendo algo aqui en el foro, aunque la verdad con el puro robots text he podido controlar que me indexa google...

Saludos a todos
  #18 (permalink)  
Antiguo 23/09/2011, 16:05
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 19 años
Puntos: 2053
Respuesta: Duda con archivo robot.txt

metafrases propones casi lo mismo que yo. Si en vez de un archivo html, lo añades php ya puedes añadir redirecciones.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #19 (permalink)  
Antiguo 24/09/2011, 00:58
Usuario no validado
 
Fecha de Ingreso: mayo-2011
Mensajes: 1.231
Antigüedad: 13 años, 6 meses
Puntos: 228
Respuesta: Duda con archivo robot.txt

Cita:
Iniciado por RBZ Ver Mensaje
metafrases propones casi lo mismo que yo. Si en vez de un archivo html, lo añades php ya puedes añadir redirecciones.
Orale, esta no me la sabia, o sea que le pongo un archivo index.php a por ejemplo la carpeta de imagenes?

y ya con eso el google bot solo indexa el contenido vacio del index.php en esa carpeta?

o se le debe poner algo de codigo para evitar que google indexe 2 index.php iguales en mi web? yo digo lo de 2 index.php porque mi web esta hecha en .php .... o ahi le pongo un index.html?

Y si le pongo al codigo del index.html solo la linea de no index no follow que pasaria se seguiria a indexar las demás carpetas?

Gracias por su respuestas

Saludos
  #20 (permalink)  
Antiguo 24/09/2011, 16:18
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 19 años
Puntos: 2053
Respuesta: Duda con archivo robot.txt

merino_renato no entendí bien la pregunta. La ventaja de que subas un index.php frente al index.html es que puedes añadir el código para hacer una redirección 301.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #21 (permalink)  
Antiguo 24/09/2011, 16:37
Usuario no validado
 
Fecha de Ingreso: mayo-2011
Mensajes: 1.231
Antigüedad: 13 años, 6 meses
Puntos: 228
Respuesta: Duda con archivo robot.txt

Cita:
Iniciado por RBZ Ver Mensaje
merino_renato no entendí bien la pregunta. La ventaja de que subas un index.php frente al index.html es que puedes añadir el código para hacer una redirección 301.
Hola:

Yo me referia a que apenas ayer me di cuenta que cuando escribes una url de una carpeta de nuestro servidor, pues aparecen los elementos contenidos en el navegador, yo no entendia a lo que se referian con vulnerar la seguridad, pero supongo que es que si saben como se llaman tus archivos pues más facil pueden intentar hackearlos, no?

Y entonces apenas entendi que si a una carpeta que de nuestro servidor que no tiene index, le ponemos un index vacio se ve en blanco la pantalla en lugar de verse los archivos contenidos en la carpeta.

Lo que pasa es que mi web esta hecha en php y entonces lo inverti puse un index.html , es a esto a lo que se referian, no?

Lo que no me queda muy claro es que no para que la redireccion?

por si alguien se mete , por ejemplo a:

www.ejemplo.com/carpetaprivada/

En vez de que el servidor le muestre el contenido en blanco lo redirecciona a la web que yo quiera?

Hay un linea de codigo en htaccess para esto?

o es manual en cada carpeta?

Yo le puse a los index.html que subi a esas carpestas el no index, no follow...
O bastaria conque le pusiera el rel canonical hacia mi index en php?

Bueno creo que ni yo entendi nada de lo que escribi, ojala y alguien entienda lo que escribi, si no pues mientras ya se quedan en blanco mis carpetas "privadas"

Saludos
  #22 (permalink)  
Antiguo 24/09/2011, 16:55
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 19 años
Puntos: 2053
Respuesta: Duda con archivo robot.txt

Con el index en blanco vale. La idea que propongo es una solución fácil para esos sitios que suben las imágenes a mayor tamaño en una carpeta. A menudo Google acaban indexando el directorio vacio. La redirección serviría para enviar al buscador a la página donde aparecen las imágenes originales... creo que ahora el que se ha explicado fatal soy yo.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #23 (permalink)  
Antiguo 01/10/2011, 19:57
Avatar de hackcrack  
Fecha de Ingreso: abril-2011
Mensajes: 331
Antigüedad: 13 años, 7 meses
Puntos: 9
Respuesta: Duda con archivo robot.txt

Hu gracias a todos por tomarse el trabajo de responderme, perdon la demora es que estuve un tiempo sin internet.

Creo que bien como dicen al principio, seria bloquear la carpeta donde contienen las imagenes con Disallow para que no las indexe los buscadores y agregar la linea Options All -Indexes para que no se permita la navegacion por directorios.

Despues google solito se encargaria de indexar los post donde se encuentran las imagenes, entonces ahora una vez que busque una imagen en vez de mostrarme el directorio me mostraria el post.
__________________
Los mejores juegos de PC gratis en ******

Etiquetas: contenido, google, url
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 22:58.