A ver si me explico mejor pues. por ejemplo esto es un fragmento del texto que quiero procesar:
“¡Oh tío mío! ¡No hay inconveniente; podemos entrar sin peligro!”
De este texto quiero obtener los caracteres
", ahora bien, los caracteres
" NO existen, porque por algun motivo que desconozco aparecen dos tipos de caracteres que lo sustituyen:
“ y
”
Mi dudas son varias, porque aparecen esos caracteres y no el caracter
" ?, como hago para cambiar la codificación y que no aparezcan esos caracteres sino el mencionado y asi poder buscarlo?, si esto no es posible, como hago para obtener encontrar esos nuevos caracteres en el texto?. Todo esto lo quiero hacer con ER.
Espero haberme explicado mejor. Gracias por tu ayuda razpeitia
si a la cadena que he puesto de ejemplo le hago :
me da:
Código Python:
Ver originalu'\u201c\xa1Oh t\xedo m\xedo! \xa1No hay inconveniente; podemos entrar sin peligro!\u201d\n'
y originalmente estoy usando para buscar el caracter
":
Código Python:
Ver originalcraro = re.compile(r"""
#Para explicar grupo
(
(\")
)
""", re.VERBOSE|re.U|re.I)
pero obviamente no funciona porque ese no es (
") el caracter que aparece en el texto como he dicho