Для разработчика Python, который пытается добавить функцию преобразования PDF в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.
Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования PDF в MHTML. Если файл PDF простой, то это всего две строки кода. Загрузите файл PDF и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.
Как Преобразование PDF в MHTML в Python
- Загрузите исходный PDF-файл, используя класс Document .
- Создайте экземпляр HtmlSaveOptions
- Установите export_roundtrip_information как True
- Укажите SaveFormat как MHTML.
- Вызовите метод
save, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл PDF преобразуется в MHTML по указанному пути.
Требования к конвертации
- Для преобразования формата PDF в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
- Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
- Или используйте следующие команды pip
pip install aspose.words - Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL
Сохранить PDF в MHTML в Python — просто
Преобразование PDF в MHTML в Python
Ключевые сценарии использования
Создание веб‑архива
Преобразуйте PDF‑файлы в MHTML для хранения и просмотра в браузере.Публикация портативных документов
Поделитесь содержимым документа в самодостаточном веб‑дружественном формате.Сохранение контента
Сохраните визуальную и текстовую информацию в архиве, подходящем для веб‑рабочих процессов.Взаимодействие систем
Используйте вывод MHTML там, где обмен документами должен соответствовать браузерным стандартам.
Сценарии автоматизации
Автоматизированные конвейеры веб‑конвертации
Скрипты Python могут преобразовывать PDF в файлы MHTML для систем цифровой публикации.Рабочие процессы архивного распределения
Преобразованные выводы могут быть доставлены в репозитории, управляющие содержимым веб‑архивов.Пакетная публикация документов
Большие наборы PDF могут быть преобразованы в портативные веб‑файлы без ручного вмешательства.Экспорт динамического контента
Системы могут генерировать версии MHTML документов по запросу для обмена или рецензирования.