La fórmula de tf-idf es la siguiente:
Cita:
$unterminobuscado/$totalterminosbuscados = Se evalúa cuantos aciertos tiene un registro, por ejemplo: busco "animales salvajes de áfrica", entonces un resultado posee animales de áfrica (tiene 3 términos acertados, dividido los 4 términos totales).$unterminobuscado/$totalterminosbuscados * log10($numtotaldocumentos/$numdedocumentosdondeaparecetermino)
$numtotaldocumentos/$numdedocumentosdondeaparecetermino = El primero es el total de documentos, que es bastante simple. El segundo es el número de documentos donde aparece cada termino, tomando el ejemplo anterior "animales salvajes de áfrica", evaluamos cuantos tiene animales, cuantos salvajes, y etc.
Bueno, ahora mi duda.
Cómo logro evaluar, mediante PHP, cada término por separado. Ya que las variables $totalterminosbuscados y $numtotaldocumentos lo tengo, pero me quedan 2 incógnitas en la cuenta.
Si por lo menos puedo resolver 1, quedaría una sola que se puede conseguir mediante una cuenta.
Saludos y espero que puedan ayudarme!!