Преобразование PDF в HTML через Python

Преобразование PDF в HTML в Python. Программисты могут использовать этот пример кода для экспорта PDF в HTML в любой платформе.NET Framework, .NET Core и PHP, VBScript, C++ через COM Interop.

Преобразование PDF в HTML в Python for .NET

Как преобразовать PDF в HTML? Вы можете легко программно преобразовать документ из формата PDF в формат HTML с помощью современного API Python для обработки документов. Используйте всего несколько строк кода для высококачественного преобразования файлов. Библиотека Aspose.PDF позволит любому разработчику легко решить задачи преобразования PDF в HTML с помощью Python.

Более подробное описание фрагмента кода и других возможных форматов преобразования см. на страницах Документация. Кроме того, вы можете проверить другие конверсии форматов, которые поддерживаются нашей библиотекой.

С помощью библиотеки Aspose.PDF для .NET вы можете программно преобразовать PDF в HTML. Программное обеспечение PDF от Aspose идеально подходит для частных лиц, малого или крупного бизнеса. Поскольку он способен обрабатывать большой объем информации, выполняйте преобразование быстро и эффективно и защищайте ваши данные. Отличительной особенностью Aspose.PDF является API для преобразования PDF в HTML. Особенность этого подхода заключается в том, что вам нужно только открыть диспетчер пакетов NuGet, найти «Aspose.PDF для .NET» и установить его без особых сложных настроек. (Для установки используйте команду из консоли диспетчера пакетов). Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода, преобразованный PDF в HTML. Можно также использовать следующую команду из консоли диспетчера пакетов:

Python Package Manager Console

pip install aspose-pdf

Как преобразовать PDF в HTML


Разработчики Python for .NET могут легко загружать и конвертировать файлы PDF в HTML всего за несколько строк кода.

  1. Добавить пространство имен в соответствующий класс
  2. Инициализация нового документа
  3. Вызовите метод Document.Save, передав путь к выходному файлу и SaveFormat.Html в качестве параметров
  4. Наконец, сохраните выходной HTML-файл

Вот пример, демонстрирующий, как преобразовать PDF в HTML в Python. Чтобы преобразовать файл PDF в формат HTML, выполните следующие простые шаги. Сначала загрузите файл PDF, а затем просто сохраните его как файл HTML. Можно использовать полные имена файлов как для чтения PDF, так и для записи HTML. Выходное содержимое и форматирование HTML будут идентичны исходному документу PDF.

Пример: Преобразование PDF в HTML с помощью Python

Этот пример кода показывает преобразование PDF в HTML на Python

Input file:

File not added

Output format:

HTML

Output file:

    def convert_PDF_to_HTML(self, infile, outfile):
        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # Open PDF document

        document = Document(path_infile)

        # save document in HTML format

        save_options = HtmlSaveOptions()
        
        document.Save(path_outfile, save_options)

Библиотека Python for .NET для преобразования PDF в HTML

Aspose.PDF для Python через API .NET поддерживает большинство установленных стандартов PDF и спецификаций PDF. Он позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, собственные шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF-документы. Aspose.PDF для Python через .NET предоставляет отличные функции безопасности для разработки защищенных PDF-документов. Некоторые из ключевых функций Aspose.PDF для Python через API .NET включают в себя:

  • Возможность чтения и экспорта PDF-файлов в нескольких форматах изображений, включая BMP, GIF, JPEG и PNG.
  • Задайте основную информацию (например, об авторе, создателе) PDF-документа.
  • Функции преобразования: конвертируйте PDF в Word, Excel и PowerPoint. Конвертируйте PDF в форматы изображений. Конвертируйте PDF-файл в формат HTML и наоборот. Конвертируйте PDF в формат EPUB, текст, XPS и т. д.

Дополнительную информацию о Aspose.PDF для Python через API .NET можно найти в нашей документации по использованию API.