10/01/2014, 08:52
|
|
Respuesta: Leer texto de un MP3 o AVI Dragonfly es una interfaz con motores de reconocimiento de voz, no un motor en sí. Es decir, que para usarlo tendrás que instalar Dragon Naturally Speaking o el sistema de reconocimiento de voz incluído en Windows.
Para tener algo más completo, lo recomendable es el paquete CMU Sphinx, pero hacerlo funcionar es bastante engorroso, lo estuve investigando hace poco y no encontré buena documentación como para arrancar de cero en Python.
Los resultados no son particularmente satisfactorios a menos que uno se tome el tiempo de modificar los parámetros del modelo del lenguaje, y aún así esa clase de modificaciones es aplicable solamente a un estilo de voz (cuando no a una persona en particular)
Si tu sueño es hacer algo tipo Siri, no creo poder recomendarte nada. Si es para algo más sencillo, tipo transcripción automática de notas de clase o algo así, a lo mejor Sphinx te ayuda.
Saludos. |