Вопросы по теме 'pypdf'

Как получить номер страницы закладки
from typing import List from PyPDF2 import PdfFileReader from PyPDF2.generic import Destination def get_outlines(pdf_filepath: str) -> List[Destination]: """Get the bookmarks of a PDF file.""" with...
6879 просмотров
schedule 11.07.2022

Как я могу прочитать закладки из pdf на Python?
Я искал в высоком и низком порядке, pyPdf, pyPdf2, pdfminer и тому подобное, все, что я хочу, - это прочитать закладки PDF-файла и соответствующие им страницы, так что если закладка «глава 1» находится на странице 5, и я напишите print (закладки) он...
2056 просмотров
schedule 17.06.2023

Создание плоского PDF-файла с помощью Python
Когда я печатаю PDF-файл из любого из исходных PDF-файлов, размер файла уменьшается, и текстовые поля, представленные в форме, удаляются. Короче говоря, он сглаживает файл. Я хочу добиться такого поведения. Следующий код для создания PDF-файла с...
9458 просмотров
schedule 03.12.2023

Как добавить номер страницы в файл PDF?
Я все утро пытался добавить номера страниц в pdf-документ, но не могу понять. Я хотел бы использовать python с pyPdf или reportlab. У кого-нибудь есть идеи?
5904 просмотров
schedule 08.07.2023

Как извлечь все ссылки из файла PDF?
По стандарту ссылки скрыты в Аннотациях (раздел 12.5.6.5 спецификаций). Отсюда легко извлечь адрес: other-method">Извлечение ссылок на страницы в другом PDF из PDF с помощью Python или другого метода Но очень часто ссылки представлены не как...
22457 просмотров
schedule 08.04.2022

PyPdf: разделить каждую страницу на две части, заполнить пустым пространством
У меня есть файл PDF (A4, книжная верстка), каждую страницу которого я хочу разделить пополам по высоте. Выходной документ также должен иметь формат A4 и портретную ориентацию, но нижняя половина каждой страницы должна быть пустой. Я видел...
1415 просмотров
schedule 23.11.2022

Как установить poppler в ubuntu 15.04?
Poppler - это библиотека для рендеринга PDF, основанная на кодовой базе xpdf-3.0. Я уже скачал файл tar.xz с официального сайта http://poppler.freedesktop.org/ Но Я не знаю что делать с этим файлом Есть ли какая-нибудь команда для установки или...
21669 просмотров
schedule 24.05.2023

Читать все типы файлов в Python
Я пытаюсь извлечь информацию из файлов разных типов в python (.pdf .doc .docx) и преобразовать в .txt, но при обработке разных файлов я получаю место и новые строки, когда они не требуются, и многие другие проблемы. Я пробовал PyPDF2 и PDF-менеджер....
502 просмотров
schedule 03.02.2024

Невозможно перебрать список -pyPDF2
Выполнение кода ниже вызывает ошибку в строке pdfReader pdf=['/somepath/a.pdf','/somepath/b.pdf'] for count in range(len(pdf)): name=pdf[count] pdfFileObj = open(name, 'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) #Error at...
775 просмотров
schedule 16.11.2022