最新の Python ライブラリを使用すると、 Python via .NET 開発者は、数行のコードで PDF を1つの HTML に結合できます。 PDF 変換エンジンは、元の PDF レイアウトと構造を分析し、結合されたコンテンツを HTML 形式にエクスポートします。
使用 Python に変換する PDF へ HTML 最大限の柔軟性とスピードで。オンラインデモを実行し、ブラウザで HTML PDF Conversion APIは、多数の便利なオプションをサポートしています。
PDF を HTML 変換するには、すべての低レベルの詳細を処理 Python ライブラリを使用するだけです。
複数の PDF を変換し、結果を単一の HTML ファイルとして保存します。 Python を使用してコードを開発する場合、これは思ったよりも簡単になります。ドキュメントを反復処理して HTML 形式に Python 例を参照してください。
pip install aspose-words
コピー
import aspose.words as aw
fileNames = [ "Input1.pdf", "Input2.pdf" ]
output = aw.Document()
# 追加する前に、宛先ドキュメントからすべてのコンテンツを削除します。
output.remove_all_children()
for fileName in fileNames:
input = aw.Document(fileName)
# ソースドキュメントを宛先ドキュメントの最後に追加します。
output.append_document(input, aw.ImportFormatMode.KEEP_SOURCE_FORMATTING)
output.save("Output.html");
Python パッケージはPyPiリポジトリでホストしています。 "Aspose.Words for Python via .NET" 開発者環境にインストールする方法のステップバイステップの説明に従ってください。
このパッケージは Python ≥3.5 および <3.12 と互換性があります。 Linux 用のソフトウェアを開発する場合は、 製品ドキュメントの gcc および libpython の追加要件を参照してください。
PDFを他の多くのファイル形式にマージできます。