Foros del Web » Estrategias Digitales y Negocios Online » SEO »

Eliminar URLs vía robots.txt ???

Estas en el tema de Eliminar URLs vía robots.txt ??? en el foro de SEO en Foros del Web. Me he cambiado de sistema de foros y en el sistema antiguo se indexaron un montón de páginas con la siguiente URL: image-vp1234.html en donde ...
  #1 (permalink)  
Antiguo 10/06/2008, 13:04
Avatar de ASLAN  
Fecha de Ingreso: septiembre-2007
Mensajes: 419
Antigüedad: 17 años, 2 meses
Puntos: 2
Pregunta Eliminar URLs vía robots.txt ???

Me he cambiado de sistema de foros y en el sistema antiguo se indexaron un montón de páginas con la siguiente URL: image-vp1234.html en donde 1234 puede ser cualquier número (más de 20.000)

La instrucción que agregué en robots.txt es la siguiente:
Código:
User-agent: *
Disallow: /image-vp*.html
Está correcta ???

Gracias por la ayuda
__________________
Registros Akáshicos
  #2 (permalink)  
Antiguo 10/06/2008, 16:07
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 8 meses
Puntos: 2114
Respuesta: Eliminar URLs vía robots.txt ???

La sintaxis es correcta.
Y en la implementación, lo que conseguís es decirle a los crawlers que no indexen esas páginas.
Pero en tu caso ya están indexadas.
Tendrás que establecer otra estrategia, distinta del uso de robots.txt

Crear reglas mediante mod rewrite y comenzar a solicitar la baja de las URLs de los índices de Google.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #3 (permalink)  
Antiguo 11/06/2008, 12:02
Avatar de ASLAN  
Fecha de Ingreso: septiembre-2007
Mensajes: 419
Antigüedad: 17 años, 2 meses
Puntos: 2
Respuesta: Eliminar URLs vía robots.txt ???

El problema es que son muchas y Google sólo permite solicitud de baja de URLs específicas, no con máscaras como las señaladas

Habrá otro modo ???
__________________
Registros Akáshicos
  #4 (permalink)  
Antiguo 11/06/2008, 12:21
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 8 meses
Puntos: 2114
Respuesta: Eliminar URLs vía robots.txt ???

Perdón, me corrijo:
Google dice:

Cita:
Para eliminar un sitio o directorio completo, utilice un archivo robots.txt.
Su contenido se eliminará del índice la próxima vez que Google rastree su sitio web.
Así las cosas, cuando el bot te visite nuevamente y lea el robots.txt eliminará de sus índices las URLs.

La salvedad está, en que cuando uno quiere acerlerar el proceso puede solicitar la baja desde las Herramientas para Webmasters.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #5 (permalink)  
Antiguo 12/06/2008, 09:41
Avatar de ASLAN  
Fecha de Ingreso: septiembre-2007
Mensajes: 419
Antigüedad: 17 años, 2 meses
Puntos: 2
Respuesta: Eliminar URLs vía robots.txt ???

Excelente
Está hecho entonces
Muchas gracias
__________________
Registros Akáshicos
  #6 (permalink)  
Antiguo 14/06/2008, 20:58
 
Fecha de Ingreso: enero-2005
Mensajes: 95
Antigüedad: 19 años, 10 meses
Puntos: 0
Respuesta: Eliminar URLs vía robots.txt ???

tengo una pequeña duda al usar esta forma

User-agent: *
Disallow: /themes/

las carpetas(temas) que esten dentro de themes tampoco seran indexados? es que es lo que deseo. estara bien solo especificar el directorio raiz o debo ir subdirectorio uno por uno
  #7 (permalink)  
Antiguo 15/06/2008, 17:32
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 8 meses
Puntos: 2114
Respuesta: Eliminar URLs vía robots.txt ???

Cita:
Iniciado por frony Ver Mensaje
tengo una pequeña duda al usar esta forma

User-agent: *
Disallow: /themes/

las carpetas(temas) que esten dentro de themes tampoco seran indexados? es que es lo que deseo. estara bien solo especificar el directorio raiz o debo ir subdirectorio uno por uno
Con esa directiva le estás informando a todos los crawlers que no ingresen a tu directorio themes; por lógica consecuencia, tampoco tienen permiso para explorar llos directorios y archivos contenidos en ella.

Por cierto, el directorio raiz es "/", "/themes" es una directorio que depende del mismo.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #8 (permalink)  
Antiguo 20/06/2008, 15:58
Avatar de ASLAN  
Fecha de Ingreso: septiembre-2007
Mensajes: 419
Antigüedad: 17 años, 2 meses
Puntos: 2
Respuesta: Eliminar URLs vía robots.txt ???

Otra duda
Para qué sirve la máscara $

Ejemplo:
User-agent: *
Disallow: /*.gif$

Gracias
__________________
Registros Akáshicos
  #9 (permalink)  
Antiguo 20/06/2008, 16:25
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.264
Antigüedad: 19 años, 8 meses
Puntos: 2114
Respuesta: Eliminar URLs vía robots.txt ???

Cita:
Iniciado por ASLAN Ver Mensaje
Otra duda
Para qué sirve la máscara $

Ejemplo:
User-agent: *
Disallow: /*.gif$

Gracias
En robotstxt.org no encontré referencia alguna; fuente que consulté ya que nunca vi esa máscara.
Precisamente Alicorna, cita en su blog (en una entrada de fecha de hoy):

Cita:
Please note that this method is not correct or valid in the usual protocol, so while it works fine for Googlebot, don't try to apply it to any other search engine bot (or your site may be excluded entirely and therefore not even get the pages indexed).
Este método no es correcto o válido en el protocolo actual, mientras esto trabaja bien para Googlebot, no intente aplicarlo en ningún otro bot de un motor de búsqueda (...).

La finalidad de esa máscara es para precisamente remover todos los archivos que llevan esa máscara. Fuente: Web Tools
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #10 (permalink)  
Antiguo 21/06/2008, 14:01
 
Fecha de Ingreso: febrero-2003
Mensajes: 795
Antigüedad: 21 años, 9 meses
Puntos: 2
Respuesta: Eliminar URLs vía robots.txt ???

Si son muchas vas a perder muchas visitas hasta que indexe los foros nuevos, lo ideal aquí es jugar con el htaccess y redireccionar a cada web con su nuevo equivalente. Es una sugerencia
__________________
Carlo Rodríguez
florerias en lima
  #11 (permalink)  
Antiguo 24/06/2008, 11:57
Avatar de ASLAN  
Fecha de Ingreso: septiembre-2007
Mensajes: 419
Antigüedad: 17 años, 2 meses
Puntos: 2
Respuesta: Eliminar URLs vía robots.txt ???

y muy buena por lo demás
lo intentaré
gracias
__________________
Registros Akáshicos
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 00:40.