Python を使用して WORD を MHTML に変換する

Microsoft Word® をインストールせずに、Python アプリケーションで WORD から MHTML、HtmlFixed、および HTML への変換。

 

WORD から MHTML (Web アーカイブ形式) への変換機能または HtmlFixed を追加しようとしている Python 開発者は、アプリケーション内の絶対配置要素を使用してドキュメントを HTML 形式で保存したいと考えています。 Aspose.Total for Python via .NET API は、変換プロセスの自動化に役立ちます。これは、さまざまな形式を扱うさまざまな API の完全なパッケージです。

Aspose.Total for Python via .NET パッケージの一部である Aspose.Words for Python via .NET API を使用して、WORD から MHTML への変換機能を追加します。 WORD ファイルが単純な場合、コードは 2 行だけです。 WORD ファイルをロードし、MHTML または HTML_FIXED としての SaveFormat 列挙と共に、適切なファイル パスを使用して保存メソッドを呼び出します。 ただし、ドキュメント モデルを元のモデルに近いものに復元する必要がある場合は、結果のドキュメント内に往復情報と呼ばれる追加情報を保存する必要があります。

方法 Python で WORD を MHTML に変換する

  • Document クラスを使用してソース WORD ファイルをロードする
  • HtmlSaveOptions のインスタンスを作成します。
  • export_roundtrip_information を True に設定します。
  • SaveFormat を MHTML として指定します。
  • パラメータとして出力ファイルのパスと SaveFormat を指定して save メソッドを呼び出します。 したがって、WORD ファイルは指定されたパスで MHTML に変換されます。

変換要件

  • WORD から MHTML または HtmlFixed 形式への変換には、Python 3.5 以降が必要です。
  • プロジェクト内の API を PyPI ( Aspose.Words ) から直接参照する
  • または、次の pip コマンド pip install aspose.words を使用します。
  • さらに、Microsoft Windows または Linux ベースの OS ( Words の詳細を参照) および Linux の場合は、gcc および libpython の追加要件を確認し、 INSTALL の手順に従ってください。
 

PythonでWORDをMHTMLに保存 - シンプル

 
 

Python での WORD から MHTML への変換

 

WORD の変換オプションを Python で探索

WORD を EMAIL に変換 (ファイルを電子メールで送信する)
WORD を EML に変換 (電子メールメッセージ)
WORD を EMLX に変換 (Apple メールのメッセージ)
WORD を ICS に変換 (カレンダーファイル)
WORD を MBOX に変換 (電子メール メールボックス ファイル)
WORD を MSG に変換 (Outlook メッセージ アイテム ファイル)
WORD を ODP に変換 (OpenDocument プレゼンテーション形式)
WORD を OFT に変換 (Outlook ファイル テンプレート)
WORD を OST に変換 (Outlook オフライン ストレージ テーブル)
WORD を POT に変換 (Microsoft PowerPoint テンプレート ファイル)
WORD を POTM に変換 (Microsoft PowerPoint テンプレート ファイル)
WORD を POTX に変換 (Microsoft PowerPoint テンプレートのプレゼンテーション)
WORD を POWERPOINT に変換 (プレゼンテーションファイル)
WORD を PPS に変換 (PowerPoint スライド ショー)
WORD を PPSM に変換 (マクロを有効にしたスライド ショー)
WORD を PPSX に変換 (PowerPoint スライド ショー)
WORD を PPT に変換 (パワーポイントによるプレゼンテーション)
WORD を PPTM に変換 (マクロが有効なプレゼンテーション ファイル)
WORD を PPTX に変換 (オープン XML プレゼンテーション形式)
WORD を PST に変換 (Outlook 個人用ストレージ テーブル)
WORD を VCF に変換 (vCard ファイル)
WORD を CSV に変換 (カンマ区切りの値)
WORD を DIF に変換 (データ交換フォーマット)
WORD を EXCEL に変換 (スプレッドシートのファイル形式)
WORD を FODS に変換 (OpenDocument フラット XML スプレッドシート)
WORD を ODS に変換 (OpenDocument スプレッドシート)
WORD を SXC に変換 (StarOffice Calc スプレッドシート)
WORD を TSV に変換 (タブ区切りの値)
WORD を XLAM に変換 (Excel マクロ有効アドイン)
WORD を XLS に変換 (Microsoft Excel バイナリ形式)
WORD を XLSB に変換 (Excel バイナリ ワークブック)
WORD を XLSM に変換 (マクロが有効なスプレッドシート)
WORD を XLSX に変換 (XML ワークブックを開く)
WORD を XLT に変換 (Excel 97 - 2003 テンプレート)
WORD を XLTM に変換 (Excel マクロ有効テンプレート)
WORD を XLTX に変換 (Excel テンプレート)

WORD ファイル形式とは

広く使用されているワープロ ソフトウェアである Microsoft Word は、文書を保存および共有するためのさまざまなファイル形式を提供しています。デフォルトの形式は DOC で、以前のバージョンの Word で一般的でした。ただし、ファイル サイズが小さく、データ回復機能が強化されているため、より新しく効率的な形式である DOCX がデフォルトの選択肢となっています。 PDF は、書式設定とレイアウトを保持しながら、どのデバイスでも簡単に表示できるもう 1 つの一般的に使用される形式です。

さまざまなソフトウェア アプリケーションとの互換性を確保するため、RTF 形式は簡単に交換できるプレーン テキスト形式として機能します。一方、HTML は Web ページの作成に特化して使用されます。オープンソース形式の ODT はさまざまなソフトウェア アプリケーションとの互換性を保証しますが、TXT はテキスト自体のみを含む単純なプレーン テキスト形式です。

適切な形式の選択は、対象とするアプリケーション、互換性などのいくつかの要素に左右されます。他のソフトウェアの使用状況、ドキュメントのサイズと複雑さなどによって異なります。利用可能な形式をよく理解することで、ユーザーはワークフローを最適化し、特定のドキュメントに最適な形式に関して情報に基づいた決定を下すことができます。

MHTML ファイル形式とは

MHTML は MIME HTML の略で、HTML コードとそれに関連するリソースを 1 つのファイルに結合するファイル形式です。 MultiPurpose Internet Mail Extension HTML の略です。 MHTML ファイルは、画像、CSS スタイルシート、JavaScript などのすべてのコンテンツを含む Web ページを 1 つのファイルに保存するためによく使用されます。

MHTML ファイルは、多くの場合、ユーザーがオフライン用に Web ページを保存するときに Web ブラウザによって作成されます。閲覧またはアーカイブの目的。 MHTML は、必要なすべてのリソースを 1 つのファイルにバンドルすることで、インターネット接続や元のサーバーへのアクセスがなくても、Web ページを正確に表示およびレンダリングできるようにします。

MHTML 形式は MIME 標準に従っています。インターネット上でさまざまな種類のデータをエンコードして交換するために使用されます。マルチパート MIME エンコーディングを使用して、HTML コードと関連リソースを 1 つのファイルにパッケージ化します。通常、ファイルには .mht または .mhtml のファイル拡張子が付いています。

MHTML ファイルは、Internet Explorer、Microsoft Edge、Opera など、その形式をサポートする Web ブラウザで開いて表示できます。一部のテキスト エディタや専用ソフトウェアでは、MHTML ファイルを開いて編集する機能も提供されています。

MHTML 形式では、ユーザーが Web ページを 1 つのファイルとして保存および共有できるため、移植性と利便性の点で利点があります。ページのレイアウト、書式設定、およびリンクされたリソースを確実に保持します。ただし、MHTML は HTML や PDF などの他の Web 形式ほど広く使用されておらず、互換性はソフトウェアやプラットフォームによって異なる可能性があることに注意してください。