Кодирование текста для Kindle с помощью Python

По сути, я сканирую текст с веб-страницы с помощью python с помощью Beautifulsoup, затем сохраняю его как HTML и отправляю на свой Kindle в виде почтового вложения. Проблема в; Kindle поддерживает кодировку Latin1 (ISO-8859-1), однако текст, который я анализирую, включает символы, которые не являются частью Latin1. Поэтому, когда я пытаюсь закодировать текст как Latin1, Python выдает следующую ошибку из-за недопустимых символов:

UnicodeEncodeError: кодек 'latin-1' не может кодировать символ u'’' в позиции 17: порядковый номер не в диапазоне (256)

Когда я пытаюсь закодировать его как UTF-8, на этот раз скрипт работает отлично, но Kindle заменяет некоторые несовместимые символы тарабарщиной.

user1599986 31.08.2015 источник

comment

Может быть, вам следует опубликовать код, если вы хотите, чтобы мы помогли вам его исправить. - Daniel Roseman 31.08.2015

comment

Какую версию Киндла вы используете? Похоже, что Unicode поддерживается начиная с версии 3 (см. здесь). - lenz 31.08.2015

Ответы (1)

arrow_upward
0
arrow_downward

Используйте 1_

Ранее я использовал <meta charset="UTF-8" />, который, похоже, не работал.

Daniel Apt 27.09.2020

Кодирование текста для Kindle с помощью Python

Ответы (1)

Вопросы по теме