Я работаю с существующей библиотекой - цель библиотеки - извлечь текст из PDF-файлов, чтобы сверить его с ожидаемыми значениями и проверить качество записанных данных по сравнению с данными в pdf.
Я ищу способ кратко вытащить конкретную страницу текста с учетом строки, которая должна попадать только на эту конкретную страницу.
var pdfDocument = new Document(file.PdfFilePath);
var textAbsorber = new TextAbsorber{
ExtractionOptions = {
FormattingMode = TextExtractionOptions.TextFormattingMode.Pure
}
};
pdfDocument.Pages.Accept(textAbsorber);
foreach (var page in pdfDocument.Pages)
{
}
Я застрял внутри части foreach(var page in pdfDocument.Pages)
... или это правильная область для поиска?