Вопросы по теме 'pdftotext'
shell_exec() не выполняет команду pdftotext
Я установил необходимую библиотеку, и она работает в терминале, но не в моем файле php. Мой код:
$mypdf = shell_exec('/usr/local/bin/pdftotext test.pdf test.txt');
echo $mypdf;
Если я выполняю эту команду /usr/local/bin/pdftotext test.pdf...
3125 просмотров
schedule
02.03.2023
Не могу прочитать pdf файл
Я пытаюсь создать приложение, которое может читать файлы PDF. Я использую это руководство:
http://www.codeproject.com/Articles/14170/Extract-Text-from-PDF-in-C-100-NET
но не понимаю, что означает "файл" - это весь URL-адрес с вашего...
913 просмотров
schedule
02.08.2022
Как я могу заставить poppler использовать дополнительные данные кодирования в нестандартном каталоге?
Я тестирую pdftotext как часть poppler . Он был предварительно установлен на общем хосте, который я использую. Я хотел бы добавить данные кодировки poppler, которые содержат языковые пакеты, чтобы помочь бороться с такими ошибками, как "Missing...
624 просмотров
schedule
20.10.2022
Извлечь данные таблицы из PDF
Есть ли какой-либо последовательный способ извлечения таблиц из файлов PDF? Любые инструменты?
Что я уже сделал:
Я опробовал pdftotext инструмент. Он имеет возможность конвертировать в макет HTML.
В чем проблема:
Информация...
12266 просмотров
schedule
05.06.2023
Могу ли я указать координаты pdftotext на странице PDF?
я знаю это
pdftotext -f 42 -l 42 -layout mypdf.pdf
дает мне извлеченное содержимое страницы 42 из mypdf.pdf , отформатированное с «правильным» макетом. Но у меня есть страница с двумя столбцами, где строки между столбцами не совпадают....
687 просмотров
schedule
19.11.2022
Какая кодировка pdftotext соответствует Winansi pdf?
Я пытаюсь преобразовать немецкоязычный pdf в текст с помощью утилиты Poppler pdftotext, но я не получаю правильных символов ни для одного из символов с диакритическими знаками.
pdffonts myfile.pdf дает следующий результат:
name...
1115 просмотров
schedule
26.09.2023
TypeError при преобразовании pdf в txt файл
Я написал функцию, которая преобразует каждый PDF-файл из каталога в текст, и я хочу получить преобразованный текст из PDF-файла в виде txt-файлов. Я получаю сообщение об ошибке «TypeError: ожидаемая строка, байты или объект os.PathLike, а не кортеж»...
138 просмотров
schedule
30.10.2022
Полный пакет сборки pdftotext для развертывания на AWS-Lambda с Python3.7
Я пытаюсь развернуть небольшой код Python 3.7, который использует «pdftotext» на AWS-Lambda. Мне удалось успешно запустить код на моем локальном компьютере (Mac). Используя виртуальную среду, как указано в документации AWS, я создал пакет...
124 просмотров
schedule
17.06.2022
Невозможно импортировать pdftotext после установки с помощью conda и poppler, Windows 10
Я пытаюсь использовать pdftotext, но он не импортируется.
Я использую Windows 10 (64-разрядная версия) на рабочем ноутбуке Lenovo IdeaPad S340.
Следуя указаниям здесь и здесь (что было очень полезно), я:
Установлены инструменты сборки...
5809 просмотров
schedule
15.06.2022
Создайте несколько текстовых файлов, соответствующих именам файлов PDF, из каталога в Python.
Я только начинаю практиковать python с преобразованием файлов. Пожалуйста, помогите мне с этим.
Я пытаюсь преобразовать файлы .PDF в файлы .TXT, которые я могу заставить работать для одного файла, используя приведенный ниже код:
import...
537 просмотров
schedule
18.05.2023