Преобразуйте PDF s в XML s в Python. Быстро. Просто. Никаких внешних зависимостей.

Преобразование PDF в XML в Python. Программисты могут использовать этот пример кода для экспорта PDF в XML в любой платформе.NET Framework, .NET Core и PHP, VBScript, C++ через COM Interop.

Преобразуйте PDF в XML в файле Aspose.PDF для Python via .NET

Как преобразовать PDF в XML? Вы можете легко программно преобразовать документ из формата PDF в формат XML с помощью современного Python API для обработки документов. Используйте всего несколько строк кода для преобразования файлов в высоком качестве. Библиотека Aspose.PDF позволит любому разработчику легко решить задачи преобразования PDF в XML с помощью Python.

Более подробное описание фрагмента кода и других возможных форматов конвертации см. на страницах Документация. Кроме того, вы можете ознакомиться с другими конверсиями форматов, которые поддерживаются нашей библиотекой.

С помощью библиотеки Aspose.PDF для Python через .NET вы можете программно преобразовать PDF в XML. Программное обеспечение PDF от Aspose идеально подходит для частных лиц, малого или крупного бизнеса. Поскольку он способен обрабатывать большой объем информации, выполняйте преобразование быстро и эффективно и защищайте ваши данные. Особенностью Aspose.PDF является API для преобразования PDF в XML. Особенность этого подхода заключается в том, что вам нужно только открыть менеджер пакетов PyPI, найти aspose-pdf и установить его без особых сложных настроек. Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода преобразования PDF в XML. Вы также можете использовать следующую команду из консоли или терминала:

Console

pip install aspose-pdf

Как преобразовать PDF в XML


Разработчики Python могут легко загрузить и преобразовать файлы PDF в XML всего за несколько строк кода.

  1. Импортируйте необходимые модули из aspose.pdf библиотеки, в том числе класс Document для загрузки PDF-файлов. Прежде чем продолжить, убедитесь, что необходимые библиотеки установлены и импортированы.
  2. Укажите путь к входному PDF-документу, объединив indir с infile, обеспечив правильную структуру каталогов для правильного размещения входного файла.
  3. Создайте экземпляр объекта Document и загрузите указанный входной PDF-файл. Этот шаг необходим для доступа к содержимому PDF для дальнейшей обработки.
  4. Создайте экземпляр объекта PdfXmlSaveOptions, который будет использоваться для указания выходного формата в виде PDF-XML-файла. Этот формат полезен для конвертации сложных PDF-файлов с макетами и форматированием в более редактируемый формат.
  5. Используйте загруженный PDF-документ и созданный объект PdfXmlSaveOptions для сохранения файла в формате PDF XML, который преобразует содержимое PDF в формат на основе XML, который можно редактировать.
  6. Распечатайте сообщение об успешном выполнении, указывающее, что входной PDF-файл был преобразован в PDF-файл XML, вместе с именами входных и выходных файлов для справки.

Вот пример, демонстрирующий, как преобразовать PDF в XML в Python. Выполните следующие простые шаги, чтобы преобразовать файл PDF в формат XML. Сначала загрузите файл PDF, а затем просто сохраните его как файл XML. Полные имена файлов можно использовать как для чтения PDF, так и для записи XML. Выходное содержимое и форматирование XML будут идентичны исходному документу PDF.

Пример: преобразование PDF в XML с помощью Python

В этом примере кода показано преобразование PDF в XML Python

Input file:

File not added

Output format:

XML

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
save_options = apdf.PdfXmlSaveOptions()
document.save(path_outfile, save_options)

print(infile + " converted into " + outfile)

Преобразуйте PDF в XML с помощью файла Aspose.PDF для Python via .NET

Aspose.PDF для Python через API.NET поддерживает большинство устоявшихся стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, пользовательские шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python с помощью .NET API включают в себя:

  • Возможность чтения и экспорта PDF в нескольких форматах изображений, включая BMP, GIF, JPEG и PNG.
  • Задайте основную информацию (например, об авторе, создателе) PDF-документа.
  • Функции конвертации: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в EPUB, текст, XPS и т. д.

Дополнительную информацию о Aspose.PDF для Python через .NET API можно найти в нашей документации по использованию API.