Python 経由で PDF を TEXT にマージ

Python を使用して、.NET 上で PDF ドキュメントを単一のフォーマット TEXT にマージします。プログラマーはこのサンプルコードを使用して、.NET Framework、.NET Core で PDF を、COM Interop 経由で PHP、VBScript、Delphi、C++ を組み合わせることができます。

Python を使用して PDF を TEXT にマージ

PDF を TEXT にマージするにはどうすればいいですか?.NET 経由の Python 用Aspose.PDF ライブラリを使えば、PDF を TEXT にプログラム的にマージできます。AsposeのPDFソフトウェアは、個人、中小企業、大企業に最適です。大量の情報を処理できるため、連結を迅速かつ効率的に実行し、データを保護します。Aspose.PDF 特有の機能として、PDF を TEXT にマージするための API があります。この方法の特徴は、NuGet パッケージマネージャーを開いて「Aspose.pdf for .NET」を検索し、特別な複雑な設定なしでインストールするだけでよいことです。(インストールにはパッケージマネージャーコンソールのコマンドを使用してください)。ライブラリのインストールの詳細については、ドキュメント ページで確認してください。ライブラリの利点を確認するには、PDF から TEXT への変換コードスニペットを使用してみてください。

Python Package Manager Console

pip install aspose-pdf

Python を使用して PDF を TEXT にマージする方法


Python for .NET 開発者は、わずか数行のコードで PDF ファイルを TEXT に簡単にロードしてマージできます。

  1. 2 つの PDF ファイルを読み込む
  2. テキストアブソーバーの作成
  3. テキストアブソーバーを両方の PDF に適用して PDF からテキストを抽出する
  4. 抽出したテキストの保存
  5. 抽出したテキストをファイルに書き込む

PDF を Python の TEXT にマージする方法を示す例を次に示します。複数の文書を 1 つのファイルに簡単に結合できます。Python でコードを開発している場合、この作業は思ったより簡単かもしれません。PDF の読み取りと TEXT の書き込みの両方に、完全修飾ファイル名を使用できます。Python を使用して、同じまたは異なるファイルタイプの複数のドキュメントを 1 つのファイルにマージする方法を示したこの Python の例を参照してください。

Python for .NET を使用して PDF ファイルを結合し、TEXT として保存

例 Python: このサンプルコードは PDF から TEXT への連結を示しています

Input file:

File not added

File not added

Output format:

TEXT

Output file:


# read PDF files to Aspose Document
first_doc = aspose.pdf.Document("1.pdf")
second_doc = aspose.pdf.Document("2.pdf")

# create text absorber for extract text
text_absorber = aspose.pdf.text.TextAbsorber()
first_doc.Accept(text_absorber)
second_doc.Accept(text_absorber)
extracted_text = text_absorber.Text
with open("Merger_pdf_text.txt", "w") as f:
    f.write(extracted_text)

PDF を TEXT に結合するための Python for .NET ライブラリ

.NET API 経由の Python 用 Aspose.PDF は、確立されている PDF 標準と PDF 仕様のほとんどをサポートしています。開発者は表、グラフ、画像、ハイパーリンク、カスタムフォントなどを PDF ドキュメントに挿入できます。さらに、PDF 文書を圧縮することもできます。.NET 経由の Python 用 Aspose.PDF は、安全な PDF 文書を開発するための優れたセキュリティ機能を備えています。.NET API 経由の Aspose.PDF for Python の主な機能には次のものがあります。

  • BMP、GIF、JPEG、PNG を含む複数のイメージフォーマットで PDF を読み取ったりエクスポートしたりすることができます。
  • PDF ドキュメントの基本情報 (作成者、作成者など) を設定します。
  • 変換機能:PDF をワード、エクセル、パワーポイントに変換します。PDF を画像形式に変換します。PDF ファイルを HTML 形式に、またはその逆に変換します。PDF を EPUB、テキスト、XPS などに変換します。

.NET API 経由の Aspose.PDF for Python の詳細については、API の使用方法に関する当社の ドキュメント を参照してください。