Tus problemas son:
- La codificacion de tus palabras y principalmente:
- Caracteres que delimitan palabras, que se resuelve con algo como:
o con str_word_count() pero por mas que queria no recordaba el nombre de la funcion hasta que @lolainas la colocó