Python を使用して PDF を MHTML に変換する

Microsoft Word® をインストールせずに、Python アプリケーションで PDF から MHTML、HtmlFixed、および HTML への変換。

 

PDF から MHTML (Web アーカイブ形式) への変換機能または HtmlFixed を追加しようとしている Python 開発者は、アプリケーション内の絶対配置要素を使用してドキュメントを HTML 形式で保存したいと考えています。 Aspose.Total for Python via .NET API は、変換プロセスの自動化に役立ちます。これは、さまざまな形式を扱うさまざまな API の完全なパッケージです。

Aspose.Total for Python via .NET パッケージの一部である Aspose.Words for Python via .NET API を使用して、PDF から MHTML への変換機能を追加します。 PDF ファイルが単純な場合、コードは 2 行だけです。 PDF ファイルをロードし、MHTML または HTML_FIXED としての SaveFormat 列挙と共に、適切なファイル パスを使用して保存メソッドを呼び出します。 ただし、ドキュメント モデルを元のモデルに近いものに復元する必要がある場合は、結果のドキュメント内に往復情報と呼ばれる追加情報を保存する必要があります。

方法 Python で PDF を MHTML に変換する

  • Document クラスを使用してソース PDF ファイルをロードする
  • HtmlSaveOptions のインスタンスを作成します。
  • export_roundtrip_information を True に設定します。
  • SaveFormat を MHTML として指定します。
  • パラメータとして出力ファイルのパスと SaveFormat を指定して save メソッドを呼び出します。 したがって、PDF ファイルは指定されたパスで MHTML に変換されます。

変換要件

  • PDF から MHTML または HtmlFixed 形式への変換には、Python 3.5 以降が必要です。
  • プロジェクト内の API を PyPI ( Aspose.Words ) から直接参照する
  • または、次の pip コマンド pip install aspose.words を使用します。
  • さらに、Microsoft Windows または Linux ベースの OS ( Words の詳細を参照) および Linux の場合は、gcc および libpython の追加要件を確認し、 INSTALL の手順に従ってください。
 

PythonでPDFをMHTMLに保存 - シンプル

 
 

Python での PDF から MHTML への変換

 

PDF の変換オプションを Python で探索

PDF を EMAIL に変換 (ファイルを電子メールで送信する)
PDF を EML に変換 (電子メールメッセージ)
PDF を EMLX に変換 (Apple メールのメッセージ)
PDF を ICS に変換 (カレンダーファイル)
PDF を MBOX に変換 (電子メール メールボックス ファイル)
PDF を MSG に変換 (Outlook メッセージ アイテム ファイル)
PDF を OFT に変換 (Outlook ファイル テンプレート)
PDF を OST に変換 (Outlook オフライン ストレージ テーブル)
PDF を PST に変換 (Outlook 個人用ストレージ テーブル)
PDF を VCF に変換 (vCard ファイル)