Estoy creando un sistema para hacer una nube de tags para un sitio (si alguien conoce algun sistema ya hecho me ahorrara tiempo y trabajo XD)
Con strip_tags elimino los tags (x)html, luego uso str_word_count($html, 1) para contar las palabras del documento (todo el html lo obtengo capturanod la salida en un buffer con ob_start(); ), hasta aqui bien, ahora yo quiero contar la densidad de las palabras del array, dado que algunas se repiten deseo eliminar los duplicados (si, ya se, array_unique() ), pero ademas de eliminar los duplicados debo contarlos a medida que los elimino, para asi despues armar la nube de tags con los X (pongamos 20) elementos de mayor densidad.
Estuve buscando, pero no he encontrado nada para eliminar y contar elemntos duplicados y no lo he logrado hacer (mas bien si, pero es muy malo, jaja.... consume muchos recursos y demora demasiado, esta mal :( )
Pues bien, me vendria perfecto si alguien:
- Sabe como contar y eliminar elementos duplicados en una matriz
- Sabe donde puedo encontrar un sistema de "nube de tags" que reciba html como entrada y arroje una salida basado en la densidad de palabras del texto y sin necesidad de definirle palabras claves
Desde ya muchas gracias.