Ошибка при анализе файла Xml с помощью RapidXML

У меня возникает ошибка «parse_error», когда я пытаюсь проанализировать файл xml, содержащий определенные японские иероглифы:

退

Если я поменяю этот кандзи на другой, синтаксический анализ будет работать хорошо.

Любая идея?

PS: я разбираю файл с помощью rapidXML

Вот пример xml-файла:

<?xml version="1.0" encoding="UTF-8"?>
<Root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="Exam.xsd">
    <Patient>
     <ESUID>CRodrigueTest-20120423-104410</ESUID>
     <Lastname>退</Lastname>
    </Patient>
</Root>

c++ rapidxml

Rodrigue Rens 20.04.2012 источник

comment

Является ли XML UTF-8? Если это UTF-16 или 32, у RapidXml есть некоторые проблемы с ними, о которых вы можете прочитать здесь. . Убедитесь, что ваш документ закодирован таким образом, который поддерживает RapidXml, и измените свой вопрос, чтобы он содержал сведения о кодировке XML-документа. - Cornstalks 20.04.2012

comment

Да, xml в UTF-8. Я приложу xml документ в понедельник. - Rodrigue Rens 20.04.2012

comment

У RapidXML нет проблем с этим XML, если он правильно закодирован в UTF-8. Покажите свой код, так как я полагаю, что проблема в том, как вы используете Rapidxml. - Roddy 06.10.2016

Ответы (1)

arrow_upward
0
arrow_downward

Здесь на самом деле проблема не в библиотеке rapidXML. Проблема может быть связана с basic_ifstream.basic_ifstream, поскольку по умолчанию файл открывается только в режиме ansi. Поэтому мы должны установить его в utf-8. Используйте приведенный ниже фрагмент кода:

    basic_ifstream<wchar_t> fFileStream(fullxmlfilepath, ios::binary);

    std::locale loc(std::locale::classic(), new std::codecvt_utf8<wchar_t>);
    fFileStream.imbue(loc);  

    xmlFile = new rapidxml::file<wchar_t>(fFileStream);
    doc.parse<parse_declaration_node>(xmlFile ->data());

Jayesh Vaghasiya 19.08.2016

comment

Это неправильно на нескольких уровнях: OP использует UTF-8, а не UTF-16 или 32. UTF-8 (и, следовательно, все кодовые точки Unicode, включая японский, китайский и т. д.) полностью поддерживается rapidxml, поэтому нет нужно использовать другую библиотеку. - Roddy; 06.10.2016

comment

Да, ты прав, Родди. На самом деле я нашел основную причину этой проблемы. Проблема не в библиотеке rapidxml. В моем случае проблемы были в basic_ifstream. По умолчанию basic_ifstream открывает файл только в режиме ansi. Поэтому нам нужно открыть его в режиме utf-8. - Jayesh Vaghasiya; 14.11.2016

comment

Добавьте ниже строки кода в существующий поток. std::locale loc(std::locale::classic(), новый std::codecvt_utf8‹wchar_t›); XMLFileStream.imbue(loc); - Jayesh Vaghasiya; 14.11.2016

Ошибка при анализе файла Xml с помощью RapidXML

Ответы (1)

Вопросы по теме