Python経由でPDFをHTMLに変換

PDF から HTML への Python 変換。プログラマーはこのサンプルコードを使用して、COM 相互運用機能を介して任意の.NET フレームワーク、.NET Core、PHP、VBScript、C++ 内の PDF を HTML にエクスポートできます。

Python via .NET の PDF を HTML に変換

PDF を HTML に変換するにはどうすればよいでしょうか? 最新のドキュメント処理 Python API を使えば、プログラムで簡単に PDF 形式から HTML 形式へのドキュメント変換が可能です。わずか数行のコードで、高品質なファイル変換が可能です。Aspose.PDF ライブラリを使えば、Python を使用して PDF から HTML 形式への変換を簡単に行うことができます。

コード スニペットやその他の変換形式の詳細については、ドキュメント ページをご覧ください。また、ライブラリでサポートされているその他の 変換 形式についてもご確認ください。

Aspose.PDF for Python via .NET ライブラリを使えば、プログラムで PDF を HTML 形式に変換できます。 AsposeのPDFソフトウェアは、個人、中小企業、大企業に最適です。大量の情報を処理し、迅速かつ効率的に変換し、データを保護します。Aspose.PDFの特徴的な機能は、PDFをHTMLに変換するためのAPIです。このアプローチの特徴は、PyPIパッケージマネージャーを開き、aspose-pdfを検索してインストールするだけで、特別な複雑な設定は必要ありません。このライブラリのメリットを確認するには、PDFからHTMLへの変換コードスニペットを試してみてください。コンソールまたはターミナルから次のコマンドを使用することもできます。

Console

pip install aspose-pdf

PDF を HTML に変換する方法


Python via .NET 開発者は、わずか数行のコードで PDF ファイルを HTML に簡単にロードして変換できます。

  1. PDFファイルをロードするためのDocumentクラスを含むaspose.pdfライブラリから必要なモジュールをインポートします。続行する前に、必要なライブラリがインストールされ、インポートされていることを確認してください。
  2. indir と infile を結合して入力 PDF ドキュメントへのパスを指定し、入力ファイルを正しく見つけるための正しいディレクトリ構造を確保します。
  3. apdf を使用して、入力 PDF ドキュメントを Document オブジェクトに読み込みます。Document() を使用して、処理や操作のための機能やプロパティへのアクセスを許可します。
  4. HtmlSaveOptions のインスタンスを作成し、PDF ドキュメントを HTML 形式で保存するための設定を指定します。これにより、生成される HTML ファイルの構造とレイアウトが決まります。
  5. 読み込まれた Document オブジェクトを使用して、入力 PDF ドキュメントを HTML 形式で保存します。このインスタンスは、指定された HtmlSaveOptions インスタンスを save メソッドのパラメーターとして使用します。これにより、元のPDFドキュメントの内容を含むHTMLファイルが生成されます。
  6. 入力PDFがHTMLファイルに変換されたことを示す成功メッセージを印刷し、変換プロセスの完了と最終結果に関するフィードバックを提供します。

Python で PDF を HTML に変換する方法を示す例を次に示します。PDF ファイルを HTML 形式に変換するには、以下の簡単な手順に従ってください。まず PDF ファイルをアップロードしてから、HTML ファイルとして保存します。PDF の読み取りと HTML の書き込みの両方に完全修飾ファイル名を使用できます。出力される HTML の内容とフォーマットは、元の PDF ドキュメントと同じになります。

例:Python を使用して PDF を HTML に変換します

このサンプルコードは PDF から HTML Python への変換を示しています

Input file:

File not added

Output format:

HTML

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)
document = apdf.Document(path_infile)
save_options = apdf.HtmlSaveOptions()
document.save(path_outfile, save_options)

print(infile + " converted into " + outfile)

{{PRODUCTName}} を使用して PDF を HTML に変換する

.NET API 経由の Python 用 Aspose.PDF は、確立されている PDF 標準と PDF 仕様のほとんどをサポートしています。開発者は表、グラフ、画像、ハイパーリンク、カスタムフォントなどを PDF ドキュメントに挿入できます。さらに、PDF 文書を圧縮することもできます。.NET 経由の Python 用 Aspose.PDF は、安全な PDF 文書を開発するための優れたセキュリティ機能を備えています。.NET API 経由の Aspose.PDF for Python の主な機能には次のものがあります。

  • BMP、GIF、JPEG、PNG を含む複数のイメージフォーマットで PDF を読み取ったりエクスポートしたりすることができます。
  • PDF ドキュメントの基本情報 (作成者、作成者など) を設定します。
  • 変換機能:PDF をワード、エクセル、パワーポイントに変換します。PDF を画像形式に変換します。PDF ファイルを HTML 形式に、またはその逆に変換します。PDF を EPUB、テキスト、XPS などに変換します。

.NET API 経由の Aspose.PDF for Python の詳細については、API の使用方法に関する当社の ドキュメント を参照してください。