Tengo un sitio web que funciona bajo bases de datos, y tengo mas de 200.000 registros que indexar en los sitemaps.
A su vez, diariamente esos registros sufren actualizaciones, y también se van agregando nuevos. Entre las actualizaciones y las altas en la base de datos, son cientos y hasta miles los registros que pueden llegar a sufrir algún cambio por día.
Estoy armando una aplicación para esto, así que no tengo problemas con generadores online automáticos y esas cosas.
Mi duda está en como organizar esa información en los sitemaps.
Tendré un archivo indice, para poder volcar la info en varios archivos sitemaps, hasta ahí todo bien.
Pero como ordeno cada sitemap teniendo en cuenta que los registros?. Las ideas que me dan vuelta por la cabeza son:
- Establezco rangos de ID por archivo sitemap?
- Las modificaciones de los registros pueden ser de ID's muy variados. Es decir, que es probable que de tener los archivos con sitemaps por rango de ID, tenga que modificar el 80% de los sitemaps generados a diario, lo cual generaría una carga del servidor importante. Como puedo hacer para que el servidor no genere tantos archivos xml a diario?
- Teniendo en cuenta la cantidad de actualizaciones y altas que sufre la base de datos, debería tener un sitemap exclusivo para los registros que sufrieron cambios, y así optimizar el uso de transferencia por parte de goolge ya que descargaría un solo archivo?.
Esto es muy difícil, por que tendría que sacar esos archivos que quedaron en un xml aparte, de los xml ya existentes (a fin de evitar urls duplicadas).
- Es necesario tener los 200.000 registros en los sitemaps?, o puedo tener sitemaps con lo nuevo y actualizado durante la semana y, una vez que google lo indexa, ya puedo sacarlos para dejar lugar a los nuevos registros?.
- se borra lo indexado por google si un link desaparece de mis sitemap?
Desde ya muchas gracias por tomarse la molestia en leer este largo mensaje, y ponerse a pensar alguna idea. Supongo que son muchos los sitios con cientos de miles de registros que usan sitemap, y de algún modo los deben tener organizados, no?.