Ошибки чтения/анализа RDF

У меня есть несколько файлов RDF, которые я хочу импортировать в тройной магазин (AllegroGraph), но в первом файле я получаю ошибку синтаксического анализатора SAX, утверждая, что есть нераспознанный символ. После удаления рассматриваемой строки все отлично. Затем я попытался использовать валидатор W3C RDF и Jena в RDF со строкой ошибки, но все, что я получил, это несколько предупреждений о неопределенных языках (абсолютно ничего о строке ошибки). Не могли бы вы предложить метод (если возможно, Java) для поиска ошибок в файлах RDF?

Изменить: рассматриваемая строка:

<gn:alternateName xml:lang="got">&#66352;&#66374;&#66354;&#66352;&#66365;&#66361;&#66371;&#66372;&#66352;&#66365;</gn:alternateName>

person Dragos    schedule 14.11.2011    source источник
comment
Можно поконкретнее о выводе? Каково точное сообщение об ошибке, а также: как выглядит строка, выдающая ошибку?   -  person Jeen Broekstra    schedule 16.11.2011


Ответы (1)


Чтобы сделать валидацию. Инструкции есть в этой записи блога О том, как работать с Рио в целом. В частности, для проверки хитрость заключается в создании и прикреплении ParseErrorListener, который получает подробные предупреждения и ошибки от синтаксического анализатора.

Однако, поскольку вы упомянули, что проблема, с которой вы столкнулись, находится на уровне SAX/XML, вы также можете просто использовать общий валидатор XML, чтобы увидеть, что не так. Наиболее вероятная причина (но трудно сказать без подробностей) заключается в том, что где-то у вас есть неправильно закодированный символ.

person Jeen Broekstra    schedule 16.11.2011