Преобразование WORDML в MHTML с помощью Python

Преобразование WORDML в MHTML, HtmlFixed и HTML в приложениях Python без установки Microsoft Word®.

 

Для разработчика Python, который пытается добавить функцию преобразования WORDML в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.

Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования WORDML в MHTML. Если файл WORDML простой, то это всего две строки кода. Загрузите файл WORDML и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.

Как Преобразование WORDML в MHTML в Python

  • Загрузите исходный WORDML-файл, используя класс Document .
  • Создайте экземпляр HtmlSaveOptions
  • Установите export_roundtrip_information как True
  • Укажите SaveFormat как MHTML.
  • Вызовите метод save, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл WORDML преобразуется в MHTML по указанному пути.

Требования к конвертации

  • Для преобразования формата WORDML в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
  • Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
  • Или используйте следующие команды pip pip install aspose.words
  • Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL
 

Сохранить WORDML в MHTML в Python — просто

 
 

Преобразование WORDML в MHTML в Python

 

Исследуйте варианты преобразования WORDML с Python

Конвертировать WORDMLs в CSV (Значения, разделенные запятыми)
Конвертировать WORDMLs в DIF (Формат обмена данными)
Конвертировать WORDMLs в EMAIL (Файлы электронной почты)
Конвертировать WORDMLs в EML (Сообщение электронной почты)
Конвертировать WORDMLs в EMLX (Почтовое сообщение Apple)
Конвертировать WORDMLs в EXCEL (Форматы файлов электронных таблиц)
Конвертировать WORDMLs в FODS (Плоская XML-таблица OpenDocument)
Конвертировать WORDMLs в ICS (Файл календаря)
Конвертировать WORDMLs в MBOX (Файл почтового ящика электронной почты)
Конвертировать WORDMLs в MSG (Файл элемента сообщения Outlook)
Конвертировать WORDMLs в ODP (Формат презентации OpenDocument)
Конвертировать WORDMLs в ODS (Электронная таблица OpenDocument)
Конвертировать WORDMLs в OFT (Шаблон файла Outlook)
Конвертировать WORDMLs в OST (Таблица автономного хранилища Outlook)
Конвертировать WORDMLs в POT (Файлы шаблонов Microsoft PowerPoint)
Конвертировать WORDMLs в POTM (Файл шаблона Microsoft PowerPoint)
Конвертировать WORDMLs в POTX (Презентация шаблона Microsoft PowerPoint)
Конвертировать WORDMLs в POWERPOINT (Файлы презентации)
Конвертировать WORDMLs в PPS (Слайд-шоу PowerPoint)
Конвертировать WORDMLs в PPSM (Слайд-шоу с поддержкой макросов)
Конвертировать WORDMLs в PPSX (Слайд-шоу PowerPoint)
Конвертировать WORDMLs в PPT (Презентация PowerPoint)
Конвертировать WORDMLs в PPTM (Файл презентации с поддержкой макросов)
Конвертировать WORDMLs в PPTX (Формат презентации Open XML)
Конвертировать WORDMLs в PST (Таблица личного хранилища Outlook)
Конвертировать WORDMLs в SXC (Электронная таблица StarOffice Calc)
Конвертировать WORDMLs в TSV (Значения, разделенные табуляцией)
Конвертировать WORDMLs в VCF (файл визитной карточки)
Конвертировать WORDMLs в XLAM (Надстройка Excel с поддержкой макросов)
Конвертировать WORDMLs в XLS (Двоичный формат Microsoft Excel)
Конвертировать WORDMLs в XLSB (Двоичная книга Excel)
Конвертировать WORDMLs в XLSM (Электронная таблица с поддержкой макросов)
Конвертировать WORDMLs в XLSX (Открытая XML-книга)
Конвертировать WORDMLs в XLT (Шаблон Excel 97 - 2003)
Конвертировать WORDMLs в XLTM (Шаблон Excel с поддержкой макросов)

Формат файла WORDML

Microsoft Word 2003 представил собственный формат документов, известный как WordprocessingML. Этот формат, основанный на XML, использует пользовательскую схему XML для хранения различных элементов документа Word, включая текст, форматирование, изображения и другое содержимое. WordprocessingML стремится обеспечить исчерпывающее представление всей информации о документе, сохраняя при этом удобочитаемость как для человека, так и для машинного чтения.

Удобочитаемость для человека означает, что документы WordprocessingML можно легко открывать и редактировать с помощью стандартного текстового редактора. Эта доступность позволяет пользователям при необходимости напрямую манипулировать базовой структурой XML. Кроме того, WordprocessingML упрощает автоматизированную обработку и преобразование в компьютерных системах, обеспечивая беспрепятственное преобразование в другие форматы или интеграцию с различными программными приложениями.

WordprocessingML — это открытый стандарт, а это означает, что его спецификации общедоступны для справки и реализации разработчиками. Эта открытость способствовала разработке многочисленных программ, включая решения с открытым исходным кодом, такие как OpenOffice.org и LibreOffice, которые могут читать и писать документы WordprocessingML. Доступность таких инструментов расширяет доступность и совместимость файлов WordprocessingML за пределами экосистемы Microsoft Word.

Microsoft Word, будучи одной из наиболее широко используемых программ обработки текстов во всем мире, способствовала популярности WordprocessingML как XML. формат обработки текста. Его широкое признание сделало WordprocessingML распространенным стандартом для совместного использования и обмена богато отформатированными документами.

Формат файла MHTML

MHTML, сокращение от MIME HTML, представляет собой формат файла, который объединяет HTML-код и связанные с ним ресурсы в один файл. Это расшифровывается как Многоцелевое расширение Интернет-почты HTML. Файлы MHTML обычно используются для сохранения веб-страниц, включая все их содержимое, такое как изображения, таблицы стилей CSS и JavaScript, в один файл.

Файлы MHTML часто создаются веб-браузерами, когда пользователи сохраняют веб-страницы для работы в автономном режиме. для просмотра или архивирования. Объединяя все необходимые ресурсы в один файл, MHTML гарантирует, что веб-страницу можно просматривать и отображать точно, даже без подключения к Интернету или доступа к исходному серверу.

Формат MHTML соответствует стандарту MIME, который используется для кодирования и обмена различными типами данных через Интернет. Он использует составное кодирование MIME для упаковки кода HTML и связанных ресурсов в один файл. Обычно файл имеет расширение .mht или .mhtml.

Файлы MHTML можно открывать и просматривать в веб-браузерах, поддерживающих этот формат, таких как Internet Explorer, Microsoft Edge и Opera. Некоторые текстовые редакторы и специализированное программное обеспечение также позволяют открывать и редактировать файлы MHTML.

Формат MHTML предлагает преимущества с точки зрения переносимости и удобства, поскольку он позволяет пользователям сохранять веб-страницы и обмениваться ими как одним файлом, обеспечение сохранения макета страницы, форматирования и связанных ресурсов. Однако стоит отметить, что MHTML не так широко используется, как другие веб-форматы, такие как HTML или PDF, и совместимость может различаться в зависимости от программного обеспечения и платформ.