La instrucción que agregué en robots.txt es la siguiente:
Código:
Está correcta ???User-agent: * Disallow: /image-vp*.html
Gracias por la ayuda
| ||||
Eliminar URLs vía robots.txt ??? Me he cambiado de sistema de foros y en el sistema antiguo se indexaron un montón de páginas con la siguiente URL: image-vp1234.html en donde 1234 puede ser cualquier número (más de 20.000) La instrucción que agregué en robots.txt es la siguiente:
Código:
Está correcta ???User-agent: * Disallow: /image-vp*.html Gracias por la ayuda
__________________ Registros Akáshicos |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? El problema es que son muchas y Google sólo permite solicitud de baja de URLs específicas, no con máscaras como las señaladas Habrá otro modo ???
__________________ Registros Akáshicos |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? Perdón, me corrijo: Google dice: Cita: Así las cosas, cuando el bot te visite nuevamente y lea el robots.txt eliminará de sus índices las URLs. Para eliminar un sitio o directorio completo, utilice un archivo robots.txt. Su contenido se eliminará del índice la próxima vez que Google rastree su sitio web. La salvedad está, en que cuando uno quiere acerlerar el proceso puede solicitar la baja desde las Herramientas para Webmasters.
__________________ —Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit) |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? Excelente Está hecho entonces Muchas gracias
__________________ Registros Akáshicos |
| |||
Respuesta: Eliminar URLs vía robots.txt ??? tengo una pequeña duda al usar esta forma User-agent: * Disallow: /themes/ las carpetas(temas) que esten dentro de themes tampoco seran indexados? es que es lo que deseo. estara bien solo especificar el directorio raiz o debo ir subdirectorio uno por uno |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? Cita: Con esa directiva le estás informando a todos los crawlers que no ingresen a tu directorio themes; por lógica consecuencia, tampoco tienen permiso para explorar llos directorios y archivos contenidos en ella.Por cierto, el directorio raiz es "/", "/themes" es una directorio que depende del mismo.
__________________ —Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit) |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? Otra duda Para qué sirve la máscara $ Ejemplo: User-agent: * Disallow: /*.gif$ Gracias
__________________ Registros Akáshicos |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? Cita: En robotstxt.org no encontré referencia alguna; fuente que consulté ya que nunca vi esa máscara.Precisamente Alicorna, cita en su blog (en una entrada de fecha de hoy): Cita: Este método no es correcto o válido en el protocolo actual, mientras esto trabaja bien para Googlebot, no intente aplicarlo en ningún otro bot de un motor de búsqueda (...).Please note that this method is not correct or valid in the usual protocol, so while it works fine for Googlebot, don't try to apply it to any other search engine bot (or your site may be excluded entirely and therefore not even get the pages indexed). La finalidad de esa máscara es para precisamente remover todos los archivos que llevan esa máscara. Fuente: Web Tools
__________________ —Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit) |
| |||
Respuesta: Eliminar URLs vía robots.txt ??? Si son muchas vas a perder muchas visitas hasta que indexe los foros nuevos, lo ideal aquí es jugar con el htaccess y redireccionar a cada web con su nuevo equivalente. Es una sugerencia |
| ||||
Respuesta: Eliminar URLs vía robots.txt ??? y muy buena por lo demás lo intentaré gracias
__________________ Registros Akáshicos |