Преобразование PDF в TXT через Python
Преобразование PDF в TXT в Python. Программисты могут использовать этот пример кода для экспорта PDF в TXT в любой платформе.NET Framework, .NET Core и PHP, VBScript, C++ с помощью COM Interop.
Преобразование PDF в файл TXT в Aspose.PDF for Python via .NET
Как преобразовать PDF в TXT? Вы можете легко программно преобразовать документ из формата PDF в TXT с помощью современного API обработки документов Python. Используйте всего несколько строк кода для преобразования файлов с высоким качеством. Библиотека Aspose.PDF позволит любому разработчику легко решить задачи преобразования PDF в TXT с помощью Python.
Более подробное описание фрагмента кода и других возможных форматов преобразования см. на страницах Документация. Также вы можете проверить другие преобразования форматов, которые поддерживает наша библиотека.
С библиотекой Aspose.PDF для Python через .NET вы можете преобразовать PDF в TXT программно. Программное обеспечение PDF от Aspose идеально подходит для отдельных лиц, малых или крупных предприятий. Поскольку оно способно обрабатывать большой объем информации, выполнять преобразование быстро и эффективно и защищать ваши данные. Отличительной особенностью Aspose.PDF является API для преобразования PDF в TXT. Особенностью этого подхода является то, что вам нужно только открыть менеджер пакетов PyPI, найти aspose-pdf
и установить его без каких-либо специальных сложных настроек. Чтобы проверить преимущества библиотеки, попробуйте использовать фрагмент кода преобразования PDF в TXT. Вы также можете использовать следующую команду из консоли или терминала:
Как преобразовать PDF в TXT
Python-разработчики могут легко загружать и конвертировать файлы PDF в TXT всего за несколько строк кода.
- Импортируйте необходимые модули из aspose.pdf библиотеки, в том числе класс Document для загрузки PDF-файлов. Прежде чем продолжить, убедитесь, что необходимые библиотеки установлены и импортированы.
- Укажите путь к входному PDF-документу, объединив indir с infile, обеспечив правильную структуру каталогов для правильного размещения входного файла.
- Создайте экземпляр объекта Document и загрузите указанный входной PDF-файл. Этот шаг необходим для доступа к содержимому PDF для дальнейшей обработки.
- Создадим экземпляр объекта TextDevice, который будет использоваться для извлечения текста из PDF-документа. Этот тип устройства подходит для извлечения обычного текста из PDF-файлов.
- Используйте объект TextDevice для обработки второй страницы (индекс 1) загруженного PDF-документа и сохраните извлеченный текст в виде файла в указанном выходном каталоге с указанным именем выходного файла.
- Задайте путь к выходному каталогу, объединив outDir с outfile, убедившись, что полученный текстовый файл сохранен в правильном месте.
- Выведите сообщение об успешном выполнении, указывающее на то, что введенный PDF-файл был преобразован в извлеченный обычный текст.
Вот пример, демонстрирующий, как преобразовать PDF в TXT в Python. Чтобы преобразовать файл PDF в формат TXT, выполните следующие простые шаги. Сначала загрузите файл PDF, а затем просто сохраните его как файл TXT. Можно использовать полные имена файлов как для чтения PDF, так и для записи TXT. Выходное содержимое и форматирование TXT будут идентичны исходному документу PDF.
Пример: Преобразование PDF в TXT с помощью Python
Этот пример кода показывает преобразование PDF в TXT на Python
Input file:
File not added
Output format:
Output file:
Преобразуйте PDF в TXT, используя Aspose.PDF for Python via .NET
Aspose.PDF для Python через API .NET поддерживает большинство установленных стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, собственные шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python через API .NET включают в себя:
- Возможность чтения и экспорта PDF-файлов в различных форматах изображений, включая BMP, GIF, JPEG и PNG.
- Задайте основную информацию (например, об авторе, создателе) PDF-документа.
- Функции преобразования: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в формат EPUB, текст, XPS и т. д.
Дополнительную информацию о Aspose.PDF для Python через API .NET можно найти в нашей документации по использованию API.