Преобразование DOCX в MHTML с помощью Python
Преобразование DOCX в MHTML, HtmlFixed и HTML в приложениях Python без установки Microsoft Word®.
Для разработчика Python, который пытается добавить функцию преобразования DOCX в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.
Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования DOCX в MHTML. Если файл DOCX простой, то это всего две строки кода. Загрузите файл DOCX и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.
Как Преобразование DOCX в MHTML в Python
- Загрузите исходный DOCX-файл, используя класс Document .
- Создайте экземпляр HtmlSaveOptions
- Установите export_roundtrip_information как True
- Укажите SaveFormat как MHTML.
- Вызовите метод
save
, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл DOCX преобразуется в MHTML по указанному пути.
Требования к конвертации
- Для преобразования формата DOCX в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
- Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
- Или используйте следующие команды pip
pip install aspose.words
- Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL