Преобразование PDF в MHTML с помощью Python

Преобразование PDF в MHTML, HtmlFixed и HTML в приложениях Python без установки Microsoft Word®.

 

Для разработчика Python, который пытается добавить функцию преобразования PDF в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.

Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования PDF в MHTML. Если файл PDF простой, то это всего две строки кода. Загрузите файл PDF и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.

Как Преобразование PDF в MHTML в Python

  • Загрузите исходный PDF-файл, используя класс Document .
  • Создайте экземпляр HtmlSaveOptions
  • Установите export_roundtrip_information как True
  • Укажите SaveFormat как MHTML.
  • Вызовите метод save, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл PDF преобразуется в MHTML по указанному пути.

Требования к конвертации

  • Для преобразования формата PDF в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
  • Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
  • Или используйте следующие команды pip pip install aspose.words
  • Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL
 

Сохранить PDF в MHTML в Python — просто

 
 

Преобразование PDF в MHTML в Python

 

Исследуйте варианты преобразования PDF с Python

Конвертировать PDFs в EMAIL (Файлы электронной почты)
Конвертировать PDFs в EML (Сообщение электронной почты)
Конвертировать PDFs в EMLX (Почтовое сообщение Apple)
Конвертировать PDFs в ICS (Файл календаря)
Конвертировать PDFs в MBOX (Файл почтового ящика электронной почты)
Конвертировать PDFs в MSG (Файл элемента сообщения Outlook)
Конвертировать PDFs в OFT (Шаблон файла Outlook)
Конвертировать PDFs в OST (Таблица автономного хранилища Outlook)
Конвертировать PDFs в PST (Таблица личного хранилища Outlook)
Конвертировать PDFs в VCF (файл визитной карточки)