Python経由でMHTMLをXLSに変換

MHTML から XLS への Python 変換。プログラマーはこのサンプルコードを使用して、COM 相互運用機能を介して任意の.NET フレームワーク、.NET Core、PHP、VBScript、C++ 内の MHTML を XLS にエクスポートできます。

Python via .NET の MHTML を XLS に変換

MHTML を XLS に変換するにはどうすればよいでしょうか? 最新のドキュメント処理 Python API を使えば、プログラムで簡単に MHTML 形式から XLS 形式へのドキュメント変換が可能です。わずか数行のコードで、高品質なファイル変換が可能です。Aspose.PDF ライブラリを使えば、Python を使用して MHTML から XLS 形式への変換を簡単に行うことができます。

コード スニペットやその他の変換形式の詳細については、ドキュメント ページをご覧ください。また、ライブラリでサポートされているその他の 変換 形式についてもご確認ください。

Aspose.PDF for Python via .NET ライブラリを使えば、プログラムで MHTML を XLS 形式に変換できます。 AsposeのPDFソフトウェアは、個人、中小企業、大企業に最適です。大量の情報を処理し、迅速かつ効率的に変換し、データを保護します。Aspose.PDFの特徴的な機能は、MHTMLをXLSに変換するためのAPIです。このアプローチの特徴は、PyPIパッケージマネージャーを開き、aspose-pdfを検索してインストールするだけで、特別な複雑な設定は必要ありません。このライブラリのメリットを確認するには、MHTMLからXLSへの変換コードスニペットを試してみてください。コンソールまたはターミナルから次のコマンドを使用することもできます。

Console

pip install aspose-pdf

MHTML を XLS に変換する方法


Python via .NET 開発者は、わずか数行のコードで MHTML ファイルを XLS に簡単にロードして変換できます。

  1. PDFファイルをロードするためのDocumentクラスを含むaspose.pdfライブラリから必要なモジュールをインポートします。続行する前に、必要なライブラリがインストールされ、インポートされていることを確認してください。
  2. 入力PDFドキュメントへのパスを指定するには、indirとinfileを結合し、ディレクトリ構造が正しいことを確認します。この手順は、指定されたディレクトリツリー内で入力ファイルを正しく見つけるために重要です。
  3. MhtLoadOptionsクラスのインスタンスを作成して、ドキュメントを保存するための出力形式を指定します。これらのオプションは、変換された HTML ファイルの特性を制御します。MhtLoadOptions は、変換プロセスの動作を構成するために使用されます。
  4. apdf を使用して、入力 PDF ドキュメントを Document オブジェクトに読み込みます。document() です。読み込まれたドキュメントは、他の形式への処理と保存に使用されます。変換プロセスを続行する前に、PDFファイルが正しくロードされていることを確認してください。
  5. ExcelSaveOptions クラスのインスタンスを作成して、ExcelFormat 列挙型や書式設定オプションなど、ドキュメントを MS Excel 形式で保存するための設定を指定します。選択したオプションは、生成されるExcelファイルの品質、レイアウト、および全体的な外観に影響します。
  6. ExcelFormat 列挙体を使用して、書式設定とレイアウトを正確に制御するための XML スプレッドシート 2003 などのオプションを含む、目的の Excel 形式を設定します。選択した形式により、Microsoft Office アプリケーションとの互換性が確保されます。
  7. ロードしたPDFドキュメントを定義された保存オプションを使用してMS Excelファイルに保存し、指定した形式で新しい出力ファイルを生成します。この手順では、入力PDFドキュメントを互換性のあるExcel形式に変換し、さらに編集または分析します。
  8. 変換されたドキュメントを保存した後、変換が完了したことを示す成功メッセージを印刷します。この手順では、変換プロセスが成功し、指定したパスに出力ファイルが見つかることを確認します。

Python で MHTML を XLS に変換する方法を示す例を次に示します。MHTML ファイルを XLS 形式に変換するには、以下の簡単な手順に従ってください。まず MHTML ファイルをアップロードしてから、XLS ファイルとして保存します。MHTML の読み取りと XLS の書き込みの両方に完全修飾ファイル名を使用できます。出力される XLS の内容とフォーマットは、元の MHTML ドキュメントと同じになります。

例:Python を使用して MHTML を XLS に変換します

このサンプルコードは MHTML から XLS Python への変換を示しています

Input file:

File not added

Output format:

XLS

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)

save_options = apdf.ExcelSaveOptions()
save_options.format = apdf.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Save the file into MS Excel format
document.save(path_outfile, save_options)
print(infile + " converted into " + outfile)

{{PRODUCTName}} を使用して MHTML を XLS に変換する

.NET API 経由の Python 用 Aspose.PDF は、確立されている PDF 標準と PDF 仕様のほとんどをサポートしています。開発者は表、グラフ、画像、ハイパーリンク、カスタムフォントなどを PDF ドキュメントに挿入できます。さらに、PDF 文書を圧縮することもできます。.NET 経由の Python 用 Aspose.PDF は、安全な PDF 文書を開発するための優れたセキュリティ機能を備えています。.NET API 経由の Aspose.PDF for Python の主な機能には次のものがあります。

  • BMP、GIF、JPEG、PNG を含む複数のイメージフォーマットで PDF を読み取ったりエクスポートしたりすることができます。
  • PDF ドキュメントの基本情報 (作成者、作成者など) を設定します。
  • 変換機能:PDF をワード、エクセル、パワーポイントに変換します。PDF を画像形式に変換します。PDF ファイルを HTML 形式に、またはその逆に変換します。PDF を EPUB、テキスト、XPS などに変換します。

.NET API 経由の Aspose.PDF for Python の詳細については、API の使用方法に関する当社の ドキュメント を参照してください。