Python を使用して WORDML を MHTML に変換する

Microsoft Word® をインストールせずに、Python アプリケーションで WORDML から MHTML、HtmlFixed、および HTML への変換。

 

WORDML から MHTML (Web アーカイブ形式) への変換機能または HtmlFixed を追加しようとしている Python 開発者は、アプリケーション内の絶対配置要素を使用してドキュメントを HTML 形式で保存したいと考えています。 Aspose.Total for Python via .NET API は、変換プロセスの自動化に役立ちます。これは、さまざまな形式を扱うさまざまな API の完全なパッケージです。

Aspose.Total for Python via .NET パッケージの一部である Aspose.Words for Python via .NET API を使用して、WORDML から MHTML への変換機能を追加します。 WORDML ファイルが単純な場合、コードは 2 行だけです。 WORDML ファイルをロードし、MHTML または HTML_FIXED としての SaveFormat 列挙と共に、適切なファイル パスを使用して保存メソッドを呼び出します。 ただし、ドキュメント モデルを元のモデルに近いものに復元する必要がある場合は、結果のドキュメント内に往復情報と呼ばれる追加情報を保存する必要があります。

方法 Python で WORDML を MHTML に変換する

  • Document クラスを使用してソース WORDML ファイルをロードする
  • HtmlSaveOptions のインスタンスを作成します。
  • export_roundtrip_information を True に設定します。
  • SaveFormat を MHTML として指定します。
  • パラメータとして出力ファイルのパスと SaveFormat を指定して save メソッドを呼び出します。 したがって、WORDML ファイルは指定されたパスで MHTML に変換されます。

変換要件

  • WORDML から MHTML または HtmlFixed 形式への変換には、Python 3.5 以降が必要です。
  • プロジェクト内の API を PyPI ( Aspose.Words ) から直接参照する
  • または、次の pip コマンド pip install aspose.words を使用します。
  • さらに、Microsoft Windows または Linux ベースの OS ( Words の詳細を参照) および Linux の場合は、gcc および libpython の追加要件を確認し、 INSTALL の手順に従ってください。
 

PythonでWORDMLをMHTMLに保存 - シンプル

 
 

Python での WORDML から MHTML への変換

 

WORDML の変換オプションを Python で探索

WORDML を EMAIL に変換 (ファイルを電子メールで送信する)
WORDML を EML に変換 (電子メールメッセージ)
WORDML を EMLX に変換 (Apple メールのメッセージ)
WORDML を ICS に変換 (カレンダーファイル)
WORDML を MBOX に変換 (電子メール メールボックス ファイル)
WORDML を MSG に変換 (Outlook メッセージ アイテム ファイル)
WORDML を ODP に変換 (OpenDocument プレゼンテーション形式)
WORDML を OFT に変換 (Outlook ファイル テンプレート)
WORDML を OST に変換 (Outlook オフライン ストレージ テーブル)
WORDML を POT に変換 (Microsoft PowerPoint テンプレート ファイル)
WORDML を POTM に変換 (Microsoft PowerPoint テンプレート ファイル)
WORDML を POTX に変換 (Microsoft PowerPoint テンプレートのプレゼンテーション)
WORDML を POWERPOINT に変換 (プレゼンテーションファイル)
WORDML を PPS に変換 (PowerPoint スライド ショー)
WORDML を PPSM に変換 (マクロを有効にしたスライド ショー)
WORDML を PPSX に変換 (PowerPoint スライド ショー)
WORDML を PPT に変換 (パワーポイントによるプレゼンテーション)
WORDML を PPTM に変換 (マクロが有効なプレゼンテーション ファイル)
WORDML を PPTX に変換 (オープン XML プレゼンテーション形式)
WORDML を PST に変換 (Outlook 個人用ストレージ テーブル)
WORDML を VCF に変換 (vCard ファイル)
WORDML を CSV に変換 (カンマ区切りの値)
WORDML を DIF に変換 (データ交換フォーマット)
WORDML を EXCEL に変換 (スプレッドシートのファイル形式)
WORDML を FODS に変換 (OpenDocument フラット XML スプレッドシート)
WORDML を ODS に変換 (OpenDocument スプレッドシート)
WORDML を SXC に変換 (StarOffice Calc スプレッドシート)
WORDML を TSV に変換 (タブ区切りの値)
WORDML を XLAM に変換 (Excel マクロ有効アドイン)
WORDML を XLS に変換 (Microsoft Excel バイナリ形式)
WORDML を XLSB に変換 (Excel バイナリ ワークブック)
WORDML を XLSM に変換 (マクロが有効なスプレッドシート)
WORDML を XLSX に変換 (XML ワークブックを開く)
WORDML を XLT に変換 (Excel 97 - 2003 テンプレート)
WORDML を XLTM に変換 (Excel マクロ有効テンプレート)
WORDML を XLTX に変換 (Excel テンプレート)

WORDML ファイル形式とは

Microsoft Word 2003 では、WordprocessingML として知られる独自のドキュメント形式が導入されました。 XML に基づくこの形式は、カスタム XML スキーマを利用して、テキスト、書式設定、画像、その他のコンテンツを含む Word 文書のさまざまな要素を保存します。 WordprocessingML は、人間が読める品質と機械が読める品質の両方を維持しながら、すべてのドキュメント情報の包括的な表現を提供することを目的としています。

人間が読めるということは、WordprocessingML ドキュメントに簡単にアクセスし、標準のテキスト エディタを使用して編集できることを意味します。このアクセシビリティにより、ユーザーは必要に応じて基礎となる XML 構造を直接操作できるようになります。さらに、WordprocessingML は、コンピュータ システムによる自動処理と変換を容易にするように設計されており、他の形式へのシームレスな変換やさまざまなソフトウェア アプリケーションとの統合が可能になります。

WordprocessingML はオープン スタンダードです。つまり、その仕様は参照および公開されています。開発者による実装。このオープン性により、WordprocessingML ドキュメントを読み書きできる OpenOffice.org や LibreOffice などのオープンソース ソリューションを含む、多数のソフトウェア プログラムの開発が促進されました。このようなツールの利用可能性により、WordprocessingML ファイルのアクセシビリティと相互運用性が Microsoft Word エコシステムを超えて拡張されます。

Microsoft Word は、世界中で最も広く使用されているワード プロセッシング プログラムの 1 つであり、XML としての WordprocessingML の人気に貢献しています。ベースのワープロ形式。 WordprocessingML は広く受け入れられているため、豊富な形式のドキュメントを共有および交換するための一般的な標準として確立されています。

MHTML ファイル形式とは

MHTML は MIME HTML の略で、HTML コードとそれに関連するリソースを 1 つのファイルに結合するファイル形式です。 MultiPurpose Internet Mail Extension HTML の略です。 MHTML ファイルは、画像、CSS スタイルシート、JavaScript などのすべてのコンテンツを含む Web ページを 1 つのファイルに保存するためによく使用されます。

MHTML ファイルは、多くの場合、ユーザーがオフライン用に Web ページを保存するときに Web ブラウザによって作成されます。閲覧またはアーカイブの目的。 MHTML は、必要なすべてのリソースを 1 つのファイルにバンドルすることで、インターネット接続や元のサーバーへのアクセスがなくても、Web ページを正確に表示およびレンダリングできるようにします。

MHTML 形式は MIME 標準に従っています。インターネット上でさまざまな種類のデータをエンコードして交換するために使用されます。マルチパート MIME エンコーディングを使用して、HTML コードと関連リソースを 1 つのファイルにパッケージ化します。通常、ファイルには .mht または .mhtml のファイル拡張子が付いています。

MHTML ファイルは、Internet Explorer、Microsoft Edge、Opera など、その形式をサポートする Web ブラウザで開いて表示できます。一部のテキスト エディタや専用ソフトウェアでは、MHTML ファイルを開いて編集する機能も提供されています。

MHTML 形式では、ユーザーが Web ページを 1 つのファイルとして保存および共有できるため、移植性と利便性の点で利点があります。ページのレイアウト、書式設定、およびリンクされたリソースを確実に保持します。ただし、MHTML は HTML や PDF などの他の Web 形式ほど広く使用されておらず、互換性はソフトウェアやプラットフォームによって異なる可能性があることに注意してください。