No se por que pero hay muchos '\x00' cuando transformas a utf-8, probablemente el archivo .DAT contiene esos \x00 también.
Código Python:
Ver originalimport codecs
import re
with codecs.open("ANO90_53_00_02_MES.DAT", 'r', encoding="shift-jis") as in_f:
with codecs.open("ANO90_53_00_02_MES.txt", 'w', encoding="utf-8") as out_f:
data = in_f.read()
p = re.compile('\x00+')
data = p.sub('\n', data)
out_f.write(data)