Python を使用して DOC を MHTML に変換する

Microsoft Word® をインストールせずに、Python アプリケーションで DOC から MHTML、HtmlFixed、および HTML への変換。

 

DOC から MHTML (Web アーカイブ形式) への変換機能または HtmlFixed を追加しようとしている Python 開発者は、アプリケーション内の絶対配置要素を使用してドキュメントを HTML 形式で保存したいと考えています。 Aspose.Total for Python via .NET API は、変換プロセスの自動化に役立ちます。これは、さまざまな形式を扱うさまざまな API の完全なパッケージです。

Aspose.Total for Python via .NET パッケージの一部である Aspose.Words for Python via .NET API を使用して、DOC から MHTML への変換機能を追加します。 DOC ファイルが単純な場合、コードは 2 行だけです。 DOC ファイルをロードし、MHTML または HTML_FIXED としての SaveFormat 列挙と共に、適切なファイル パスを使用して保存メソッドを呼び出します。 ただし、ドキュメント モデルを元のモデルに近いものに復元する必要がある場合は、結果のドキュメント内に往復情報と呼ばれる追加情報を保存する必要があります。

方法 Python で DOC を MHTML に変換する

  • Document クラスを使用してソース DOC ファイルをロードする
  • HtmlSaveOptions のインスタンスを作成します。
  • export_roundtrip_information を True に設定します。
  • SaveFormat を MHTML として指定します。
  • パラメータとして出力ファイルのパスと SaveFormat を指定して save メソッドを呼び出します。 したがって、DOC ファイルは指定されたパスで MHTML に変換されます。

変換要件

  • DOC から MHTML または HtmlFixed 形式への変換には、Python 3.5 以降が必要です。
  • プロジェクト内の API を PyPI ( Aspose.Words ) から直接参照する
  • または、次の pip コマンド pip install aspose.words を使用します。
  • さらに、Microsoft Windows または Linux ベースの OS ( Words の詳細を参照) および Linux の場合は、gcc および libpython の追加要件を確認し、 INSTALL の手順に従ってください。
 

PythonでDOCをMHTMLに保存 - シンプル

 
 

Python での DOC から MHTML への変換

 

DOC の変換オプションを Python で探索

DOC を EMAIL に変換 (ファイルを電子メールで送信する)
DOC を EML に変換 (電子メールメッセージ)
DOC を EMLX に変換 (Apple メールのメッセージ)
DOC を ICS に変換 (カレンダーファイル)
DOC を MBOX に変換 (電子メール メールボックス ファイル)
DOC を MSG に変換 (Outlook メッセージ アイテム ファイル)
DOC を ODP に変換 (OpenDocument プレゼンテーション形式)
DOC を OFT に変換 (Outlook ファイル テンプレート)
DOC を OST に変換 (Outlook オフライン ストレージ テーブル)
DOC を POT に変換 (Microsoft PowerPoint テンプレート ファイル)
DOC を POTM に変換 (Microsoft PowerPoint テンプレート ファイル)
DOC を POTX に変換 (Microsoft PowerPoint テンプレートのプレゼンテーション)
DOC を POWERPOINT に変換 (プレゼンテーションファイル)
DOC を PPS に変換 (PowerPoint スライド ショー)
DOC を PPSM に変換 (マクロを有効にしたスライド ショー)
DOC を PPSX に変換 (PowerPoint スライド ショー)
DOC を PPT に変換 (パワーポイントによるプレゼンテーション)
DOC を PPTM に変換 (マクロが有効なプレゼンテーション ファイル)
DOC を PPTX に変換 (オープン XML プレゼンテーション形式)
DOC を PST に変換 (Outlook 個人用ストレージ テーブル)
DOC を VCF に変換 (vCard ファイル)
DOC を CSV に変換 (カンマ区切りの値)
DOC を DIF に変換 (データ交換フォーマット)
DOC を EXCEL に変換 (スプレッドシートのファイル形式)
DOC を FODS に変換 (OpenDocument フラット XML スプレッドシート)
DOC を ODS に変換 (OpenDocument スプレッドシート)
DOC を SXC に変換 (StarOffice Calc スプレッドシート)
DOC を TSV に変換 (タブ区切りの値)
DOC を XLAM に変換 (Excel マクロ有効アドイン)
DOC を XLS に変換 (Microsoft Excel バイナリ形式)
DOC を XLSB に変換 (Excel バイナリ ワークブック)
DOC を XLSM に変換 (マクロが有効なスプレッドシート)
DOC を XLSX に変換 (XML ワークブックを開く)
DOC を XLT に変換 (Excel 97 - 2003 テンプレート)
DOC を XLTM に変換 (Excel マクロ有効テンプレート)
DOC を XLTX に変換 (Excel テンプレート)

DOC ファイル形式とは

Microsoft Word バイナリ ファイル形式 (DOC) は、Microsoft Office Word で採用されている独自のドキュメント ファイル形式です。これは、特定のコンピュータ アーキテクチャやオペレーティング システムから独立したドキュメント構造を表します。 DOC 形式はコンテナ ファイルとして機能し、バイナリ形式を利用して、書式設定されたテキスト、画像、グラフなどのさまざまな種類のデータを保存します。 DOC 形式はバイナリの性質があるため、人が読むことはできませんが、Microsoft Word や LibreOffice など、DOC ファイルの読み取りと書き込みの両方ができるプログラムがいくつか存在します。

DOC 形式は当初、 1987 年に Word for Windows 2.0 で導入されました。それ以来、何度か改訂が行われ、最新のバージョンは Office 2007 で導入された Office Open XML 形式です。DOC 形式の主な利点の 1 つは、Microsoft Word との互換性です。 、世界中で最も広く使用されているワードプロセッサ アプリケーションの 1 つです。この互換性により、ユーザーは Microsoft Word を使用して文書を作成および変更し、同じアプリケーションを使用する他のユーザーと文書を簡単に共有できるようになります。さらに、他の多くのワープロ アプリケーションは DOC 形式の読み取りおよび DOC 形式への書き込み機能を備えているため、ドキュメント共有の目的で多用途に使用できます。

DOC 形式が広く採用されているのは、Microsoft Word との統合によるものです。 、ドキュメントを作成および管理するための堅牢で機能が豊富な環境をユーザーに提供します。この形式の柔軟性は Microsoft Word を超えており、ユーザーは代替ワードプロセッサ ソフトウェアを使用して DOC ファイルを操作できます。この多用途性により、選択したワープロ アプリケーションに関係なく、ユーザー間のシームレスなドキュメント コラボレーションと交換性が保証されます。

MHTML ファイル形式とは

MHTML は MIME HTML の略で、HTML コードとそれに関連するリソースを 1 つのファイルに結合するファイル形式です。 MultiPurpose Internet Mail Extension HTML の略です。 MHTML ファイルは、画像、CSS スタイルシート、JavaScript などのすべてのコンテンツを含む Web ページを 1 つのファイルに保存するためによく使用されます。

MHTML ファイルは、多くの場合、ユーザーがオフライン用に Web ページを保存するときに Web ブラウザによって作成されます。閲覧またはアーカイブの目的。 MHTML は、必要なすべてのリソースを 1 つのファイルにバンドルすることで、インターネット接続や元のサーバーへのアクセスがなくても、Web ページを正確に表示およびレンダリングできるようにします。

MHTML 形式は MIME 標準に従っています。インターネット上でさまざまな種類のデータをエンコードして交換するために使用されます。マルチパート MIME エンコーディングを使用して、HTML コードと関連リソースを 1 つのファイルにパッケージ化します。通常、ファイルには .mht または .mhtml のファイル拡張子が付いています。

MHTML ファイルは、Internet Explorer、Microsoft Edge、Opera など、その形式をサポートする Web ブラウザで開いて表示できます。一部のテキスト エディタや専用ソフトウェアでは、MHTML ファイルを開いて編集する機能も提供されています。

MHTML 形式では、ユーザーが Web ページを 1 つのファイルとして保存および共有できるため、移植性と利便性の点で利点があります。ページのレイアウト、書式設定、およびリンクされたリソースを確実に保持します。ただし、MHTML は HTML や PDF などの他の Web 形式ほど広く使用されておらず、互換性はソフトウェアやプラットフォームによって異なる可能性があることに注意してください。