Hola!
Tengo un documento con el siguiente formato:
Código:
<DOC>
bla bla bla
</DOC>
<DOC>
blo blo blo
</DOC>
Y me gustaría extraer el texto que hay entre los tags DOC.
Había hecho esto:
Código:
pattern = '<DOC>(.*?)</DOC>'
mo = re.match(pattern,texto)
print mo.group()
Pero solo me saca la información del primer bloque <DOC> </DOC> :(