Вопросы по теме 'pdftotext'

shell_exec() не выполняет команду pdftotext
Я установил необходимую библиотеку, и она работает в терминале, но не в моем файле php. Мой код: $mypdf = shell_exec('/usr/local/bin/pdftotext test.pdf test.txt'); echo $mypdf; Если я выполняю эту команду /usr/local/bin/pdftotext test.pdf...
3125 просмотров
schedule 02.03.2023

Не могу прочитать pdf файл
Я пытаюсь создать приложение, которое может читать файлы PDF. Я использую это руководство: http://www.codeproject.com/Articles/14170/Extract-Text-from-PDF-in-C-100-NET но не понимаю, что означает "файл" - это весь URL-адрес с вашего...
913 просмотров
schedule 02.08.2022

Как я могу заставить poppler использовать дополнительные данные кодирования в нестандартном каталоге?
Я тестирую pdftotext как часть poppler . Он был предварительно установлен на общем хосте, который я использую. Я хотел бы добавить данные кодировки poppler, которые содержат языковые пакеты, чтобы помочь бороться с такими ошибками, как "Missing...
624 просмотров
schedule 20.10.2022

Извлечь данные таблицы из PDF
Есть ли какой-либо последовательный способ извлечения таблиц из файлов PDF? Любые инструменты? Что я уже сделал: Я опробовал pdftotext инструмент. Он имеет возможность конвертировать в макет HTML. В чем проблема: Информация...
12266 просмотров
schedule 05.06.2023

Могу ли я указать координаты pdftotext на странице PDF?
я знаю это pdftotext -f 42 -l 42 -layout mypdf.pdf дает мне извлеченное содержимое страницы 42 из mypdf.pdf , отформатированное с «правильным» макетом. Но у меня есть страница с двумя столбцами, где строки между столбцами не совпадают....
687 просмотров
schedule 19.11.2022

Какая кодировка pdftotext соответствует Winansi pdf?
Я пытаюсь преобразовать немецкоязычный pdf в текст с помощью утилиты Poppler pdftotext, но я не получаю правильных символов ни для одного из символов с диакритическими знаками. pdffonts myfile.pdf дает следующий результат: name...
1115 просмотров
schedule 26.09.2023

TypeError при преобразовании pdf в txt файл
Я написал функцию, которая преобразует каждый PDF-файл из каталога в текст, и я хочу получить преобразованный текст из PDF-файла в виде txt-файлов. Я получаю сообщение об ошибке «TypeError: ожидаемая строка, байты или объект os.PathLike, а не кортеж»...
138 просмотров

Полный пакет сборки pdftotext для развертывания на AWS-Lambda с Python3.7
Я пытаюсь развернуть небольшой код Python 3.7, который использует «pdftotext» на AWS-Lambda. Мне удалось успешно запустить код на моем локальном компьютере (Mac). Используя виртуальную среду, как указано в документации AWS, я создал пакет...
124 просмотров
schedule 17.06.2022

Невозможно импортировать pdftotext после установки с помощью conda и poppler, Windows 10
Я пытаюсь использовать pdftotext, но он не импортируется. Я использую Windows 10 (64-разрядная версия) на рабочем ноутбуке Lenovo IdeaPad S340. Следуя указаниям здесь и здесь (что было очень полезно), я: Установлены инструменты сборки...
5809 просмотров

Создайте несколько текстовых файлов, соответствующих именам файлов PDF, из каталога в Python.
Я только начинаю практиковать python с преобразованием файлов. Пожалуйста, помогите мне с этим. Я пытаюсь преобразовать файлы .PDF в файлы .TXT, которые я могу заставить работать для одного файла, используя приведенный ниже код: import...
537 просмотров