Hola,
según la documentación de PHP (es2.php.net/manual/en/xml.encoding.php), el parser XML que proporciona parsea, entre otras codificaciones, UTF8, de manera automática, ya que se adapta a la codificación del input.
Bien, al parser XML le proporciono un input codificado bajo UTF8 (comprobado con mb_check_encoding), pero el paser, para un input del estilo "frü" me retorna dos veces el handler 'char' con el string "fr" y otra vez con el string "ü".
He hecho pruebas y no parece que funcione bien en cuanto le pasas acentos, diéresis etc. Ni aunque le indiques la codificación del input:
xml_parser_set_option($xml_parser, XML_OPTION_TARGET_ENCODING,
"utf-8");
Aunque según la documentación esto no haría falta.
He mirado bastante por google y foros y esto parece ser un problema. No he logrado ver una soluciñon al asunto.
¿Cómo se puede parsear un XML en el que haya contenido con este tipo de caracteres?
Gracias.