Foros del Web » Programando para Internet » Python »

Leer texto de un MP3 o AVI

Estas en el tema de Leer texto de un MP3 o AVI en el foro de Python en Foros del Web. Hola to2, ¿Conocen algún módulo/framework para python que me pueda servir para extraer de un MP3 o de un AVI el texto que se oye? ...
  #1 (permalink)  
Antiguo 07/01/2014, 06:13
Avatar de jja
jja
 
Fecha de Ingreso: diciembre-2010
Ubicación: BCN
Mensajes: 47
Antigüedad: 13 años, 10 meses
Puntos: 0
Pregunta Leer texto de un MP3 o AVI

Hola to2,

¿Conocen algún módulo/framework para python que me pueda servir para extraer de un MP3 o de un AVI el texto que se oye? Es decir, lo que llaman speech2text.

He visto alguna solución pero no iba muy bien y casi todo lo que encuentro son online..

Grax!
__________________
El supremo arte de la guerra es someter al enemigo sin luchar.

Sun Tzu
  #2 (permalink)  
Antiguo 07/01/2014, 09:52
Avatar de Carlangueitor
Moderador ლ(ಠ益ಠლ)
 
Fecha de Ingreso: marzo-2008
Ubicación: México
Mensajes: 10.037
Antigüedad: 16 años, 8 meses
Puntos: 1329
Respuesta: Leer texto de un MP3 o AVI

Primer resultado de google: https://code.google.com/p/dragonfly/

Saludos
__________________
Grupo Telegram Docker en Español
  #3 (permalink)  
Antiguo 07/01/2014, 10:00
Avatar de jja
jja
 
Fecha de Ingreso: diciembre-2010
Ubicación: BCN
Mensajes: 47
Antigüedad: 13 años, 10 meses
Puntos: 0
Pregunta Respuesta: Leer texto de un MP3 o AVI

Pero dragonfly no convierte desde un archivo de audio tipo mp3/avi/etc. sino desde un micrófono o una entrada de audio no?

Gracias
__________________
El supremo arte de la guerra es someter al enemigo sin luchar.

Sun Tzu
  #4 (permalink)  
Antiguo 07/01/2014, 10:21
Avatar de Carlangueitor
Moderador ლ(ಠ益ಠლ)
 
Fecha de Ingreso: marzo-2008
Ubicación: México
Mensajes: 10.037
Antigüedad: 16 años, 8 meses
Puntos: 1329
Respuesta: Leer texto de un MP3 o AVI

No sé, ¿ya revisaste eso o solo supones?
__________________
Grupo Telegram Docker en Español
  #5 (permalink)  
Antiguo 10/01/2014, 08:52
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Leer texto de un MP3 o AVI

Dragonfly es una interfaz con motores de reconocimiento de voz, no un motor en sí. Es decir, que para usarlo tendrás que instalar Dragon Naturally Speaking o el sistema de reconocimiento de voz incluído en Windows.

Para tener algo más completo, lo recomendable es el paquete CMU Sphinx, pero hacerlo funcionar es bastante engorroso, lo estuve investigando hace poco y no encontré buena documentación como para arrancar de cero en Python.
Los resultados no son particularmente satisfactorios a menos que uno se tome el tiempo de modificar los parámetros del modelo del lenguaje, y aún así esa clase de modificaciones es aplicable solamente a un estilo de voz (cuando no a una persona en particular)

Si tu sueño es hacer algo tipo Siri, no creo poder recomendarte nada. Si es para algo más sencillo, tipo transcripción automática de notas de clase o algo así, a lo mejor Sphinx te ayuda.


Saludos.
  #6 (permalink)  
Antiguo 13/01/2014, 13:27
Avatar de jja
jja
 
Fecha de Ingreso: diciembre-2010
Ubicación: BCN
Mensajes: 47
Antigüedad: 13 años, 10 meses
Puntos: 0
Respuesta: Leer texto de un MP3 o AVI

Gracias AlvaroG, buscando por tu recomendación Sphinx, conseguí esto:

http://kermit.epska.org/2011/python-...on-helloworld/

Me bajé los módulos y los instalé y he estado jugando con cerca de 30 wav, pero la verdad que es bastante malo. De un video en el que una persona habla en ingles cerca de 30 palabras me recupera 3 o 4, y que no tienen nada que ver...
__________________
El supremo arte de la guerra es someter al enemigo sin luchar.

Sun Tzu
  #7 (permalink)  
Antiguo 21/01/2014, 01:59
Avatar de jja
jja
 
Fecha de Ingreso: diciembre-2010
Ubicación: BCN
Mensajes: 47
Antigüedad: 13 años, 10 meses
Puntos: 0
Respuesta: Leer texto de un MP3 o AVI

Alguno habéis tenido experiencias con la API de Google para Speech2Text? https://gist.github.com/alotaiba/1730160
__________________
El supremo arte de la guerra es someter al enemigo sin luchar.

Sun Tzu

Etiquetas: avi, mp3
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 16:10.