Объединить PDF с TEXT через Python

Объедините документы PDF в единые форматы TEXT на.NET с помощью Python. Программисты могут использовать этот пример кода для объединения PDF в платформе.NET Framework, .NET Core и PHP, VBScript, Delphi, C++ через COM Interop.

Объединить PDF с TEXT, используя Python

Как объединить PDF в TEXT? С помощью библиотеки Aspose.PDF для Python через .NET вы можете программно объединить PDF с TEXT. Программное обеспечение PDF от Aspose идеально подходит для частных лиц, малого или крупного бизнеса. Поскольку он способен обрабатывать большой объем информации, выполняйте объединение быстро и эффективно и защищайте ваши данные. Особенностью Aspose.PDF является API для слияния PDF с TEXT. Особенность этого подхода заключается в том, что вам нужно только открыть диспетчер пакетов NuGet, найти «Aspose.PDF для .NET» и установить его без особых сложных настроек. (Для установки используйте команду из консоли диспетчера пакетов). Ознакомьтесь с подробностями установки библиотеки на страницах Документация. Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода из преобразования PDF в TEXT.

Python Package Manager Console

pip install aspose-pdf

Как объединить PDF с TEXT через Python


Разработчики Python for .NET могут легко загружать и объединять файлы PDF в TEXT всего за несколько строк кода.

  1. Прочитайте два файла PDF
  2. Создание текстового абсорбера
  3. Извлечение текста из PDF-файлов путем применения TextAbsorber к обоим PDF-файлам
  4. Хранение извлеченного текста
  5. Запись извлеченного текста в файл

Вот пример, демонстрирующий, как объединить PDF в TEXT в Python. С легкостью объединяйте несколько документов в один файл. Если вы разрабатываете код в Python, эта задача может быть проще, чем кажется. Можно использовать полные имена файлов как для чтения PDF, так и для записи TEXT. Посмотрите этот пример Python, в котором показано, как объединить несколько документов одного или разных типов файлов в один файл с помощью Python

Объедините файлы PDF с помощью Python for .NET и сохраните как TEXT

Пример Python: в этом примере кода показано объединение PDF в TEXT

Input file:

File not added

File not added

Output format:

TEXT

Output file:


# read PDF files to Aspose Document
first_doc = aspose.pdf.Document("1.pdf")
second_doc = aspose.pdf.Document("2.pdf")

# create text absorber for extract text
text_absorber = aspose.pdf.text.TextAbsorber()
first_doc.Accept(text_absorber)
second_doc.Accept(text_absorber)
extracted_text = text_absorber.Text
with open("Merger_pdf_text.txt", "w") as f:
    f.write(extracted_text)

Библиотека Python for .NET для объединения PDF в TEXT

Aspose.PDF для Python через API.NET поддерживает большинство устоявшихся стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, пользовательские шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python через API.NET включают в себя:

  • Возможность чтения и экспорта PDF в нескольких форматах изображений, включая BMP, GIF, JPEG и PNG.
  • Задайте основную информацию (например, об авторе, создателе) PDF-документа.
  • Функции конвертации: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в EPUB, текст, XPS и т. д.

Дополнительную информацию о файле Aspose.PDF для Python через .NET API можно найти в нашей документации по использованию API.