Для разработчика Python, который пытается добавить функцию преобразования PDF в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.
Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования PDF в MHTML. Если файл PDF простой, то это всего две строки кода. Загрузите файл PDF и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.
Как Преобразование PDF в MHTML в Python
- Загрузите исходный PDF-файл, используя класс Document .
- Создайте экземпляр HtmlSaveOptions
- Установите export_roundtrip_information как True
- Укажите SaveFormat как MHTML.
- Вызовите метод
save
, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл PDF преобразуется в MHTML по указанному пути.
Требования к конвертации
- Для преобразования формата PDF в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
- Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
- Или используйте следующие команды pip
pip install aspose.words
- Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL