comparar si dos strings son semejantes

manuelle · #1 (**permalink**) 15/02/2013, 20:11

hola comunidad estoy tratando de validar en mi aplicacion que es texto que entra el usuario sea lo mas diferente posible del que tengo en base de datos, tatar de no tener elementos semejantes en la base de datos, estuve viendo la Distancia de Levenshtein pero no se contra que numero comparar para saber el nivel de semejanza de dons palabras en español, el sistema lo estoy haciendo con el idioma en español, alguien podria decirme como poder usar este algoritmo u otro que me permita no tener en mi base de datos textos semejantes ejemplo

recursos humanos
Recurso Humano

para mi las dos son iguales, agradecere cualquier ayuda posible

saludos manuelle

gildus · #2 (**permalink**) 15/02/2013, 21:12

Holas,

En el mismo manual del PHP se menciona justo en el primer ejemplo:

http://php.net/manual/es/function.levenshtein.php

Código PHP:

Ver original$lev = levenshtein($input, $word);

$input seria la palabra que buscas y $word es con quien comparas.

Si deseas compararlo con la BD, podrias traerlo en un array y recorrer con el PHP el resultado y dentro del bucle usar la funcion levenshtein, pero todo depende si tienes varios datos en tu tabla.

No estamos en la seccion de BD pero creo que una forma seria implementar un procedure en tu BD por ejemplo con MySQL:

http://webj2ee.blogspot.com/2009/01/...distancia.html

Y luego con solo consutar directamente en tu BD.

Saludos,