Объединить PDF с TEXT через Python

Объедините документы PDF в единые форматы TEXT на.NET с помощью Python. Программисты могут использовать этот пример кода для объединения PDF в платформе.NET Framework, .NET Core и PHP, VBScript, Delphi, C++ через COM Interop.

Объедините PDF с TEXT, используя Python

Как объединить PDF в TEXT? С помощью библиотеки Aspose.PDF для Python через .NET вы можете программно объединить PDF с TEXT. Программное обеспечение PDF от Aspose идеально подходит для частных лиц, малого или крупного бизнеса. Поскольку он способен обрабатывать большой объем информации, выполняйте объединение быстро и эффективно и защищайте ваши данные. Особенностью Aspose.PDF является API для слияния PDF с TEXT. Особенность этого подхода заключается в том, что вам нужно только открыть диспетчер пакетов NuGet, найти «Aspose.PDF для .NET» и установить его без особых сложных настроек. (Для установки используйте команду из консоли диспетчера пакетов). Ознакомьтесь с подробностями установки библиотеки на страницах Документация. Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода из преобразования PDF в TEXT.

Console

pip install aspose-pdf

Как объединить PDF с TEXT через Python


Разработчики Python for .NET могут легко загружать и объединять файлы PDF в TEXT всего за несколько строк кода.

  1. Прочитайте два файла PDF
  2. Создание текстового абсорбера
  3. Извлечение текста из PDF-файлов путем применения TextAbsorber к обоим PDF-файлам
  4. Хранение извлеченного текста
  5. Запись извлеченного текста в файл
  6. Запустите счетчик с 1, который будет использоваться для постепенной нумерации выходных файлов, соответствующих каждой странице.
  7. Просмотрите каждую страницу объединенного документа и обработайте ее с помощью текстового устройства.
  8. Для каждой обработанной страницы сохраните ее в новом текстовом файле с инкрементально нумерованным суффиксом, основанным на текущем значении количества. Замените расширение имени выходного файла (.txt) текущим числом, увеличенным на единицу.
  9. После обработки текущей страницы увеличьте счетчик на 1, чтобы каждая последующая страница в выходных файлах была правильно пронумерована.

Вот пример, демонстрирующий, как объединить PDF в TEXT в Python. С легкостью объединяйте несколько документов в один файл. Если вы разрабатываете код в Python, эта задача может быть проще, чем кажется. Можно использовать полные имена файлов как для чтения PDF, так и для записи TEXT. Посмотрите этот пример Python, в котором показано, как объединить несколько документов одного или разных типов файлов в один файл с помощью Python

Объедините файлы PDF с помощью Python for .NET и сохраните как TEXT

Пример Python: в этом примере кода показано объединение PDF в TEXT

Input file:

File not added

File not added

Output format:

TEXT

Output file:

import aspose.pdf as apdf

from os import path

path_infiles = [path.join(self.data_dir, infile) for infile in infiles]
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document.merge_documents(files=path_infiles)
device = apdf.devices.TextDevice()
count = 1
for page in document.pages:
    device.process(page, path_outfile.replace(".txt", str(count) + ".txt"))
    count += 1

API для Python для объединения PDF в TEXT

Aspose.PDF для Python через API.NET поддерживает большинство устоявшихся стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, пользовательские шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python через API.NET включают в себя:

  • Возможность чтения и экспорта PDF в нескольких форматах изображений, включая BMP, GIF, JPEG и PNG.
  • Задайте основную информацию (например, об авторе, создателе) PDF-документа.
  • Функции конвертации: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в EPUB, текст, XPS и т. д.

Дополнительную информацию о файле Aspose.PDF для Python через .NET API можно найти в нашей документации по использованию API.