Si uno supone que el texto es correcto, que si no ya sería demasiado complejo, una idea que yo quizá intentaría sería empezar por el final e ir intentando reconocer el ultimo trozo y cuando lo hiciera, ir recortando.
Es decir, miras primero a ver si hay unidades simples uno,dos,tres... si lo encuentras entonces lo detectas y recortas hasta ahi, despues miras las decenas... y vas subiendo en unidades de atras adelante de la cadena.
O algo así

.