Ver Mensaje Individual
  #1 (permalink)  
Antiguo 09/12/2012, 04:17
Zhukov
 
Fecha de Ingreso: junio-2004
Mensajes: 57
Antigüedad: 20 años, 5 meses
Puntos: 0
Codificación en lectura y escritura de ficheros

Hola.

Llevo un tiempo dando vueltas al tema y me estoy volviendo loco.
Comento el problema a ver si alguien tiene idea de que es lo que está fallando.

Bien, en el trabajo me han encomendado que introduzca unas traducciones a través de PoEdit para incorporarlas a una página web. Estas traducciones me las proporcionan en un archivo excel. A partir de aquí empieza mi pequeña odisea con las codificaciones de caracteres.
Para no liarme mucho diré que tras varias pruebas y correcciónes conseguí obtener tanto en el fichero origen (messages.txt) como en el destino messages.po las cadenas legibles en UTF-8.

Ahora bien, la estructura del archivo messages.txt es la siguiente (por ejemplo en Ucraniano):
Terms of use;Умови користування
Privacy;Приватності
Site map;Мапа сайту
.
.
.
.

Entonces para no copiar esta estructura a mano, he creado una aplicación sencilla en java, la cual va leyendo cadenas del .po y si la encuentra en el txt, le coloca la traducción correcta.

El proceso funciona correctamente pero el problema es que falla en algún carácter pasando a mostrar un código irreconocible, es algo como "xD1?". Es decir, tras el proceso de traducción en el archivo .po me quedan algunas cadenas como pongo a continuación
Умови кори"xD1?"тування

La idea que tengo en la cabeza es que puede ser algo de Java a la hora de interpretar la linea leida o algo así, sino no entiendo que se entiendan todos los caracteres excepto unos pocos en el archivo .po.
Eso es todo, espero que alguien tenga idea de que es lo que puede estar pasando porque estoy saturado con esto de las codificaciones y me da la impresion de estar horas con el tema y no avanzar.

Gracias de antemano

Un saludo