Gracias AlvaroG, buscando por tu recomendación Sphinx, conseguí esto:
http://kermit.epska.org/2011/python-...on-helloworld/
Me bajé los módulos y los instalé y he estado jugando con cerca de 30 wav, pero la verdad que es bastante malo. De un video en el que una persona habla en ingles cerca de 30 palabras me recupera 3 o 4, y que no tienen nada que ver...