Преобразование WORD в MHTML с помощью Python

Преобразование WORD в MHTML, HtmlFixed и HTML в приложениях Python без установки Microsoft Word®.

 

Для разработчика Python, который пытается добавить функцию преобразования WORD в MHTML (формат веб-архива) или HtmlFixed, означает, что он хочет сохранить документ в формате HTML, используя абсолютно позиционированные элементы в приложении. Aspose.Total for Python via .NET API может помочь автоматизировать процесс конвертации. Это полный пакет различных API, работающих с разными форматами.

Мы используем API Aspose.Words for Python via .NET , который является частью пакета Aspose.Total for Python via .NET , чтобы добавить функцию преобразования WORD в MHTML. Если файл WORD простой, то это всего две строки кода. Загрузите файл WORD и вызовите метод сохранения с соответствующим путем к файлу вместе с перечислением SaveFormat как MHTML или HTML_FIXED. Но в случае, если есть необходимость восстановить модель документа максимально приближенную к исходной, необходимо сохранить некоторую дополнительную информацию в результирующем документе, называемую круговой информацией.

Как Преобразование WORD в MHTML в Python

  • Загрузите исходный WORD-файл, используя класс Document .
  • Создайте экземпляр HtmlSaveOptions
  • Установите export_roundtrip_information как True
  • Укажите SaveFormat как MHTML.
  • Вызовите метод save, указав путь к выходному файлу и SaveFormat в качестве параметров. Таким образом, ваш файл WORD преобразуется в MHTML по указанному пути.

Требования к конвертации

  • Для преобразования формата WORD в MHTML или HtmlFixed требуется Python 3.5 или более поздней версии.
  • Справочные API внутри проекта непосредственно из PyPI ( Aspose.Words )
  • Или используйте следующие команды pip pip install aspose.words
  • Кроме того, для ОС на базе Microsoft Windows или Linux (см. подробнее Words ) и для Linux проверьте дополнительные требования для gcc и libpython и следуйте пошаговым инструкциям INSTALL
 

Сохранить WORD в MHTML в Python — просто

 
 

Преобразование WORD в MHTML в Python

 

Исследуйте варианты преобразования WORD с Python

Конвертировать WORDs в CSV (Значения, разделенные запятыми)
Конвертировать WORDs в DIF (Формат обмена данными)
Конвертировать WORDs в EMAIL (Файлы электронной почты)
Конвертировать WORDs в EML (Сообщение электронной почты)
Конвертировать WORDs в EMLX (Почтовое сообщение Apple)
Конвертировать WORDs в EXCEL (Форматы файлов электронных таблиц)
Конвертировать WORDs в FODS (Плоская XML-таблица OpenDocument)
Конвертировать WORDs в ICS (Файл календаря)
Конвертировать WORDs в MBOX (Файл почтового ящика электронной почты)
Конвертировать WORDs в MSG (Файл элемента сообщения Outlook)
Конвертировать WORDs в ODP (Формат презентации OpenDocument)
Конвертировать WORDs в ODS (Электронная таблица OpenDocument)
Конвертировать WORDs в OFT (Шаблон файла Outlook)
Конвертировать WORDs в OST (Таблица автономного хранилища Outlook)
Конвертировать WORDs в POT (Файлы шаблонов Microsoft PowerPoint)
Конвертировать WORDs в POTM (Файл шаблона Microsoft PowerPoint)
Конвертировать WORDs в POTX (Презентация шаблона Microsoft PowerPoint)
Конвертировать WORDs в POWERPOINT (Файлы презентации)
Конвертировать WORDs в PPS (Слайд-шоу PowerPoint)
Конвертировать WORDs в PPSM (Слайд-шоу с поддержкой макросов)
Конвертировать WORDs в PPSX (Слайд-шоу PowerPoint)
Конвертировать WORDs в PPT (Презентация PowerPoint)
Конвертировать WORDs в PPTM (Файл презентации с поддержкой макросов)
Конвертировать WORDs в PPTX (Формат презентации Open XML)
Конвертировать WORDs в PST (Таблица личного хранилища Outlook)
Конвертировать WORDs в SXC (Электронная таблица StarOffice Calc)
Конвертировать WORDs в TSV (Значения, разделенные табуляцией)
Конвертировать WORDs в VCF (файл визитной карточки)
Конвертировать WORDs в XLAM (Надстройка Excel с поддержкой макросов)
Конвертировать WORDs в XLS (Двоичный формат Microsoft Excel)
Конвертировать WORDs в XLSB (Двоичная книга Excel)
Конвертировать WORDs в XLSM (Электронная таблица с поддержкой макросов)
Конвертировать WORDs в XLSX (Открытая XML-книга)
Конвертировать WORDs в XLT (Шаблон Excel 97 - 2003)
Конвертировать WORDs в XLTM (Шаблон Excel с поддержкой макросов)

Формат файла WORD

Microsoft Word, широко используемое программное обеспечение для обработки текстов, предлагает множество форматов файлов для сохранения документов и обмена ими. Формат по умолчанию — DOC, который преобладал в более ранних версиях Word. Однако более новый и эффективный формат DOCX стал выбором по умолчанию из-за меньшего размера файла и расширенных возможностей восстановления данных. PDF — еще один широко используемый формат, который сохраняет форматирование и макет, но при этом легко просматривается на любом устройстве.

Для совместимости с различными программными приложениями формат RTF служит в качестве простого текстового формата, который можно легко заменять. HTML, с другой стороны, используется специально для создания веб-страниц. ODT, формат с открытым исходным кодом, обеспечивает совместимость с различными программными приложениями, а TXT – это простой текстовый формат, содержащий только текст.

Выбор подходящего формата зависит от нескольких факторов, в том числе от предполагаемого приложения и совместимости. с другим программным обеспечением, а также размером и сложностью документа. Ознакомившись с доступными форматами, пользователи могут оптимизировать свой рабочий процесс и принимать обоснованные решения относительно наиболее подходящего формата для своего конкретного документа.

Формат файла MHTML

MHTML, сокращение от MIME HTML, представляет собой формат файла, который объединяет HTML-код и связанные с ним ресурсы в один файл. Это расшифровывается как Многоцелевое расширение Интернет-почты HTML. Файлы MHTML обычно используются для сохранения веб-страниц, включая все их содержимое, такое как изображения, таблицы стилей CSS и JavaScript, в один файл.

Файлы MHTML часто создаются веб-браузерами, когда пользователи сохраняют веб-страницы для работы в автономном режиме. для просмотра или архивирования. Объединяя все необходимые ресурсы в один файл, MHTML гарантирует, что веб-страницу можно просматривать и отображать точно, даже без подключения к Интернету или доступа к исходному серверу.

Формат MHTML соответствует стандарту MIME, который используется для кодирования и обмена различными типами данных через Интернет. Он использует составное кодирование MIME для упаковки кода HTML и связанных ресурсов в один файл. Обычно файл имеет расширение .mht или .mhtml.

Файлы MHTML можно открывать и просматривать в веб-браузерах, поддерживающих этот формат, таких как Internet Explorer, Microsoft Edge и Opera. Некоторые текстовые редакторы и специализированное программное обеспечение также позволяют открывать и редактировать файлы MHTML.

Формат MHTML предлагает преимущества с точки зрения переносимости и удобства, поскольку он позволяет пользователям сохранять веб-страницы и обмениваться ими как одним файлом, обеспечение сохранения макета страницы, форматирования и связанных ресурсов. Однако стоит отметить, что MHTML не так широко используется, как другие веб-форматы, такие как HTML или PDF, и совместимость может различаться в зависимости от программного обеспечения и платформ.