Я использую pdf2htmlEX
для преобразования pdf в html, и выходные данные отображаются правильно, когда они создаются локально на Mac, но не когда они создаются в производстве на amazon linux. Эта проблема есть на нескольких страницах, но я буду использовать страницу 22 этого pdf. как конкретный пример.
Для неправильного вывода html (сгенерированного в Linux):
- в то время как определенный текст не виден при отображении в браузере, правильный текст находится в базовом html при проверке с помощью инструментов chrome dev
- это вызвано тем, что атрибут css
visibility
элемента (указанный именем классаff13
) установлен наhidden
, где при правильном преобразовании он установлен наvisible
- и я вижу в инструментах разработчика на вкладке вычисляемых стилей css для
rendered fonts
, что правильный шрифт -DejaVu Sans
, а неправильный шрифт -Helvetica
Я проверил и подтвердил, что DejaVuSans.ttf
(и другие шрифты DejaVu) установлены на Linux-машине по адресу /usr/share/fonts/dejavu/
, поэтому я могу предположить, что по какой-то причине программа pdf2htmlEX
не может найти файл шрифта при преобразовании, поэтому она помечает css свойство visibility
как hidden
. Я также попытался установить ядро mac (источник здесь) и microsoft fonts, перезагрузите компьютер и повторите попытку, но это не помогло.
Кто-нибудь знает, как это исправить или устранить неполадки отсюда? Заранее благодарю за любую помощь!