Преобразование PDF в TXT через Python

Преобразование PDF в TXT в Python. Программисты могут использовать этот пример кода для экспорта PDF в TXT в любой платформе.NET Framework, .NET Core и PHP, VBScript, C++ через COM Interop.

Преобразование PDF в TXT в Python for .NET

Как преобразовать PDF в TXT? Вы можете легко программно преобразовать документ из формата PDF в формат TXT с помощью современного API Python для обработки документов. Используйте всего несколько строк кода для высококачественного преобразования файлов. Библиотека Aspose.PDF позволит любому разработчику легко решить задачи преобразования PDF в TXT с помощью Python.

Более подробное описание фрагмента кода и других возможных форматов преобразования см. на страницах Документация. Кроме того, вы можете проверить другие конверсии форматов, которые поддерживаются нашей библиотекой.

С помощью библиотеки Aspose.PDF для .NET вы можете программно преобразовать PDF в TXT. Программное обеспечение PDF от Aspose идеально подходит для частных лиц, малого или крупного бизнеса. Поскольку он способен обрабатывать большой объем информации, выполняйте преобразование быстро и эффективно и защищайте ваши данные. Отличительной особенностью Aspose.PDF является API для преобразования PDF в TXT. Особенность этого подхода заключается в том, что вам нужно только открыть диспетчер пакетов NuGet, найти «Aspose.PDF для .NET» и установить его без особых сложных настроек. (Для установки используйте команду из консоли диспетчера пакетов). Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода, преобразованный PDF в TXT. Можно также использовать следующую команду из консоли диспетчера пакетов:

Python Package Manager Console

pip install aspose-pdf

Как преобразовать PDF в TXT


Разработчики Python for .NET могут легко загружать и конвертировать файлы PDF в TXT всего за несколько строк кода.

  1. Инициализация нового документа
  2. Создайте и установите экземпляр класса TextDevice с помощью параметра «Размер и разрешение»
  3. Вызов метода TextDevice.process с индексом страницы и путем к выходному файлу в качестве параметров
  4. Наконец, сохраните выходной файл TXT

Вот пример, демонстрирующий, как преобразовать PDF в TXT в Python. Чтобы преобразовать файл PDF в формат TXT, выполните следующие простые шаги. Сначала загрузите файл PDF, а затем просто сохраните его как файл TXT. Можно использовать полные имена файлов как для чтения PDF, так и для записи TXT. Выходное содержимое и форматирование TXT будут идентичны исходному документу PDF.

Пример: Преобразование PDF в TXT с помощью Python

Этот пример кода показывает преобразование PDF в TXT на Python

Input file:

File not added

Output format:

TXT

Output file:

    def convert_PDF_to_TXT(self, infile, outfile):

        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # Open PDF document

        document = Document(path_infile)

        # Create Text device

        textDevice = TextDevice()

        # Convert a particular page and save the image to stream

        textDevice.Process(document, path_outfile)

        print(infile + " converted into " + outfile)

Библиотека Python for .NET для преобразования PDF в TXT

Aspose.PDF для Python через API .NET поддерживает большинство установленных стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, собственные шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python через API .NET включают в себя:

  • Возможность чтения и экспорта PDF-файлов в нескольких форматах изображений, включая BMP, GIF, JPEG и PNG.
  • Задайте основную информацию (например, об авторе, создателе) PDF-документа.
  • Функции преобразования: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в формат EPUB, текст, XPS и т. д.

Дополнительную информацию о Aspose.PDF для Python через API .NET можно найти в нашей документации по использованию API.