У меня точно такая же проблема, как и в этом вопросе, но я не получил хорошие ответы.
Я пытаюсь проанализировать файл XML с кодировкой ISO-8859-1
, но каждый раз, когда есть слово с ударением, оно усекается и не отображается должным образом.
Example:
Original Word: Interés
Word Shown: és