hola comunidad estoy tratando de validar en mi aplicacion que es texto que entra el usuario sea lo mas diferente posible del que tengo en base de datos, tatar de no tener elementos semejantes en la base de datos, estuve viendo la Distancia de Levenshtein pero no se contra que numero comparar para saber el nivel de semejanza de dons palabras en español, el sistema lo estoy haciendo con el idioma en español, alguien podria decirme como poder usar este algoritmo u otro que me permita no tener en mi base de datos textos semejantes ejemplo
recursos humanos
Recurso Humano
para mi las dos son iguales, agradecere cualquier ayuda posible
saludos manuelle