Ver Mensaje Individual
  #1 (permalink)  
Antiguo 29/07/2010, 21:43
Avatar de AlZuwaga
AlZuwaga
Colaborador
 
Fecha de Ingreso: febrero-2001
Ubicación: 34.517 S, 58.500 O
Mensajes: 14.550
Antigüedad: 23 años, 10 meses
Puntos: 535
Stop Words - palabras a evitar en URL

Buenas. Vengo buscando (acá y afuera) acerca de qué palabras no incluir en las direcciones y a lo máximo que llego es a no artículos, no preposiciones ni palabras comunes. Bien, artículos y preposiciones está claro; pero... ¿cuáles son las palabras que suelen denominar comunes? Me gustaría mostrarles "mis elegidas" para excluir de la URL y que me digan que qué les parece. Cuáles quitarían y/o añadirían a esa "lista negra":


$lista_negra = array('a', 'ante', 'bajo', 'con', 'contra', 'de', 'desde', 'durante', 'en', 'entre', 'hacia', 'hasta', 'mediante', 'para', 'por', 'segun', 'sin', 'sobre', 'tras', 'via', 'el', 'la', 'los', 'las', 'un', 'una', 'unos', 'unas', 'y', 'e', 'ni', 'o', 'u', 'pero', 'sino', 'que', 'es', 'se', 'del', 'al');

- Aclarar unas cosas. La URL es "/contenido/titulo-de-noticia-de-la-base-de-datos.html".
- Las palabras en $lista_negra no llevan tilde pues previamente se los amputo al título.
- La preposición pro la quité de la lista pues además es el nombre de un partido político en Argentina y, por supuesto, debe figurar.

Me ayudan?
Gracias.
__________________
...___...