У меня возникает ошибка «parse_error», когда я пытаюсь проанализировать файл xml, содержащий определенные японские иероглифы:
退
Если я поменяю этот кандзи на другой, синтаксический анализ будет работать хорошо.
Любая идея?
PS: я разбираю файл с помощью rapidXML
Вот пример xml-файла:
<?xml version="1.0" encoding="UTF-8"?>
<Root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="Exam.xsd">
<Patient>
<ESUID>CRodrigueTest-20120423-104410</ESUID>
<Lastname>退</Lastname>
</Patient>
</Root>