Tenemos un sitio web en el que damos al usuario la posibilidad de realizar una serie de filtros para encontrar el resultado que desean más facilmente. El caso que, por puro desconocimiento nuestro, google empezó a indexar esos filtros (podeis imaginaros 6 tipos de filtros dan muchísimas posibilidades de URLs); de esos filtros hay muchos que llevan a páginas 404. Nos dimos cuenta de eso y empezamos a indicar en los filtros los meta noindex, nofollow, pero creemos que ha sido demasiado tarde, porque no sabemos como hacer que google deje de indexarlas, y al escribir site:www.teoobe.com sigue saliendo las URLs de filtro. Hemos leido que con las herramientas de eliminacion de URL las pueden eliminar, pero que habria que bloquearlas con la ayuda de robots.txt y/o .htaccess para que en un futuro no vuelvan a ser indexadas. Os podeis imaginar la de miles de urls que tendremos que poner, ¿es malo tantas urls en dichos archivos (robots y htaccess)?, ¿hay otra forma?.
Les mandamos diariamente el sitemap actualizado, pero siempre dice que solo ha indexado 9 urls de 8000 y pico (sin contar los filtros, que obviamente han sido excluidos del sitemap).
La página es http://www.teoobe.com, y los filtros son el abecedario de arriba y los desplegables que se encuentran abajo en azul. Muchas gracias y esperamos que nos podais ayudar, que esto nos esta trayendo de cabeza.