Antes que nada una corrección a mi anterior código:
Código C++:
Ver original#include <iostream>
#include <string>
using namespace std;
int main (){
string diccionario[]={"casas","perros","computadoras","arroz","wwomam"};
int acum, acum_mayor=0, i, j, mayor, letra, tam = sizeof diccionario / sizeof diccionario[0];
char letras[] = "abcdefghijklmnopqrstuvwxyz";
for( letra = 0 ; letras[letra] ; letra++){
for( i = 0 , acum = 0 ; i < tam ; i++)
for( j =0 ; diccionario[i][j] ; j++) /** Ó: for(j =0;j<diccionario[i].size();j++) **/
if( diccionario[i][j] == letras[letra] )
acum++;
if( acum != 0 ){
cout << letras[letra] << " se repite " << acum << endl;
if ( acum > acum_mayor ){
mayor = letra;
acum_mayor = acum ;
}
}
}
cout << endl<< letras[mayor] << " da el mayor valor de ( n = " << acum_mayor << " ) / ( N = " << tam << " ) = "<< (float) acum_mayor/tam << endl;
return 0;
}
Pero en dicho código tuve en cuenta las apariciones totales de cada letra, no en cuántas palabras aparecía dicha letra que es lo que he visto que querías.
En el siguiente código ya tengo en cuenta ese detalle y, como te comenté antes, no veo necesario el usar un array, basta ir guardando el valor mayor de la "chorizada": -n/N*(log(n/N)/log2).
Te dejo desactivado un cout, actívalo si quieres ver los otros valores:
Cita:
a aparece en 4 palabras.
c aparece en 1 palabras.
d aparece en 1 palabras.
e aparece en 1 palabras.
k aparece en 1 palabras.
m aparece en 2 palabras.
n aparece en 1 palabras.
o aparece en 4 palabras.
p aparece en 3 palabras.
r aparece en 3 palabras.
s aparece en 3 palabras.
t aparece en 1 palabras.
u aparece en 1 palabras.
w aparece en 1 palabras.
z aparece en 1 palabras.
m da el mayor valor de -n / N*( log( n / N )/ log2 = 0.528771
Y efectivamente, tal como comentastes, no el que más apariciones tiene es el valor que produce el mayor valor de
-n/N*(log(n/ N)/log2):
Código C++:
Ver original#include <iostream>
#include <string>
#include <cmath>
using namespace std;
int main (){
string diccionario[]={"kansas","perros","computadoras","arroz","pwwomam"};
int i, j, mayor, letra ;
float acum, acum_mayor=0,tam = sizeof diccionario / sizeof diccionario[0] ;
char letras[] = "abcdefghijklmnopqrstuvwxyz";
for( letra = 0 ; letras[letra] ; letra++){
for( i = 0 , acum = 0 ; i < tam ; i++){
for( j =0 ; diccionario[i][j] ; j++) /** Ó: for(j =0;j<diccionario[i].size();j++) **/
if( diccionario[i][j] == letras[letra] ){
acum++;
break;
}
}
if( acum != 0 ){
cout << letras[letra] << " aparece en " << acum << " palabras." << endl;
if ( -(acum
/tam
)*(log10(acum
/tam
)/log10(2)) > acum_mayor
){ mayor = letra;
acum_mayor
= -(acum
/tam
)*(log10(acum
/tam
)/log10(2)) ; ///cout << acum_mayor <<endl; /** por si quieres ver los otros valores **/
}
}
}
cout << endl<< letras[mayor] << " da el mayor valor de -n / N*( log( n / N )/ log2 = " << acum_mayor << endl;
return 0;
}
O a lo breve:
Cita:
m da el mayor valor de -n / N*( log( n / N ) / log2 = 0.528771
Código C++:
Ver original#include <iostream>
#include <string>
#include <cmath>
using namespace std;
int main (){
string diccionario[]={"kansas","perros","computadoras","arroz","pwwomam"};
int i, j, mayor, letra ;
float acum, acum_mayor=0,tam = sizeof diccionario / sizeof diccionario[0] ;
char letras[] = "abcdefghijklmnopqrstuvwxyz";
for( letra = 0 ; letras[letra] ; letra++){
for( i = 0 , acum = 0 ; i < tam ; i++){
for( j =0 ; diccionario[i][j] ; j++)
if( diccionario[i][j] == letras[letra] ){
acum++;
break;
}
}
if ( -(acum
/tam
)*(log10(acum
/tam
)/log10(2)) > acum_mayor
){ mayor = letra;
acum_mayor
= -(acum
/tam
)*(log10(acum
/tam
)/log10(2)) ; }
}
cout << endl<< letras[mayor] << " da el mayor valor de -n / N*( log( n / N ) / log2 = " << acum_mayor << endl;
return 0;
}
¡¡¡Saluditos!!!