Hola a todos, bueno, tengo un problema con el regexp. Estoy haciendo un script en python, el cual al principio funcionaba, pero leugo encontre una falla de la cual no he podido remediar. Tengo la siguiente cadena de texto: testo = '{\k22}{\k20}"Now" {\k20}I’ve {\k31}lost {\k38}it'
Está cadena le quiero sacar los tiempos que vienen despues de cada \k y también las silabas que vienen despues de cada }. El problema que tengo son los carácteres especiales '`´’?! y los que no contienen letra, como es el caso de "{\k22}{\k..."
Tengo la siguiente expresión:
"for ti, tx in re.findall(r'{\\[kK]([\d]+)}([\w\W+\s]+|\s+)', testo):"
lo que me devuelve:
(['{\\k20}"Now" {\\k20}I\xe2\x80\x99ve {\\k31}lost {\\k38}it'], [220])
y devería ser algo así:
(['', '"Now"', 'I’ve', 'lost ', 'it'], [22, 20, 20, 31, 38])
En que estoy fallando?. Ojalá alguien puede guiarme, ya que sólo esta semana empece a leer sobre RE. De ante mano, gracias!
:D