Cari PDF melalui Python

Pencarian dokumen PDF lanjutan. Gunakan Aspose.PDF untuk Python for .NET untuk memodifikasi dokumen PDF secara terprogram

Cara Mencari File PDF Menggunakan Python

Untuk mencari file PDF, kita akan menggunakan Aspose.PDF for Python via .NET, API yang canggih dan mudah digunakan. Buka PyPI, instal, dan cari aspose-pdf. Atau, jalankan perintah:

Console

pip install aspose-pdf

Cari File PDF melalui Python


Anda perlu Aspose.PDF for .NET untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dengan instance Document.
  2. Buat TextFragmenTabSorber Object dengan teks untuk menemukan sebagai parameter.
  3. Dapatkan semua koleksi fragmen teks yang diekstraksi.
  4. Loop melalui setiap fragmen untuk mendapatkan semua informasinya.

Cari File PDF - Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)

document = apdf.Document(path_infile)

# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = apdf.text.TextFragmentAbsorber("PDF")

# Accept the absorber for all the pages
document.pages.accept(textFragmentAbsorber)

# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
    print(f"Text : {textFragment.text}" )
    print(f"Position : {textFragment.position}")
    print(f"XIndent : {textFragment.position.x_indent}")
    print(f"YIndent : {textFragment.position.y_indent}")
    print(f"Font - Name : {textFragment.text_state.font.font_name}" )
    print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
    print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
    print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
    print(f"Font Size : {textFragment.text_state.font_size}" )
    print(f"Foreground Color : {textFragment.text_state.foreground_color} " )