Преобразование DOCX в MHTML с помощью Python
Преобразование DOCX в MHTML, HtmlFixed и HTML в приложениях Python без установки Microsoft Word®.
Для разработчика Python, который пытается добавить функцию преобразования DOCX в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.
Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования DOCX в MHTML. Если файл DOCX простой, то это всего две строки кода. Загрузите файл DOCX и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.
Как Преобразование DOCX в MHTML в Python
- Загрузите исходный DOCX-файл, используя класс Document .
- Создайте экземпляр HtmlSaveOptions
- Установите export_roundtrip_information как True
- Укажите SaveFormat как MHTML.
- Вызовите метод
save, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл DOCX преобразуется в MHTML по указанному пути.
Требования к конвертации
- Для преобразования формата DOCX в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
- Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
- Или используйте следующие команды pip
pip install aspose.words - Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL
Сохранить DOCX в MHTML в Python — просто
Преобразование DOCX в MHTML в Python
Ключевые сценарии использования
Генерация веб‑архивов
Преобразует документы DOCX в однопакетные веб‑архивы.Веб‑публикация документов
Позволяет делиться содержимым документов в виде веб‑совместимых файлов.Офлайн‑просмотр документов
Позволяет просматривать документы без внешних зависимостей.Сохранение контента
Сохраняет форматирование и ресурсы в одном архивном файле.
Сценарии автоматизации
Автоматический экспорт веб‑архивов
Системы могут автоматически преобразовывать файлы DOCX в архивы MHTML.Пакетные конвейеры публикации документов
Скрипты Python могут генерировать файлы веб‑архивов из документов.Системы распределения контента
Документы могут динамически преобразовываться в веб‑совместимые форматы архивов.