Cari File PDF di Python

Pencarian dokumen PDF asli dan kinerja tinggi menggunakan Aspose.PDF sisi server untuk API Python, tanpa menggunakan perangkat lunak apa pun seperti Microsoft atau Adobe PDF.

Cara Mencari File PDF Menggunakan Python

Untuk mencari file PDF, kita akan menggunakan Aspose.PDF for .NET API yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform python-net. Buka manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Python Package Manager Console

pip install aspose-pdf

Cari File PDF melalui Python


Anda perlu Aspose.PDF for .NET untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dengan instance Document.
  2. Buat TextFragmenTabSorber Object dengan teks untuk menemukan sebagai parameter.
  3. Dapatkan semua koleksi fragmen teks yang diekstraksi.
  4. Loop melalui setiap fragmen untuk mendapatkan semua informasinya.

Cari File PDF - Python


//Search Text from All the Pages of PDF Document
Document pdfDocument = new Document("SearchAndGetTextFromAll.pdf");

// Create TextAbsorber object to find all instances of the input search phrase
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("text");

// Accept the absorber for all the pages
pdfDocument.Pages.Accept(textFragmentAbsorber);

// Get the extracted text fragments
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;

// Loop through the fragments
foreach (TextFragment textFragment in textFragmentCollection)
{

    Console.WriteLine("Text : {0} ", textFragment.Text);
    Console.WriteLine("Position : {0} ", textFragment.Position);
    Console.WriteLine("XIndent : {0} ", textFragment.Position.XIndent);
    Console.WriteLine("YIndent : {0} ", textFragment.Position.YIndent);
    Console.WriteLine("Font - Name : {0}", textFragment.TextState.Font.FontName);
    Console.WriteLine("Font - IsAccessible : {0} ", textFragment.TextState.Font.IsAccessible);
    Console.WriteLine("Font - IsEmbedded : {0} ", textFragment.TextState.Font.IsEmbedded);
    Console.WriteLine("Font - IsSubset : {0} ", textFragment.TextState.Font.IsSubset);
    Console.WriteLine("Font Size : {0} ", textFragment.TextState.FontSize);
    Console.WriteLine("Foreground Color : {0} ", textFragment.TextState.ForegroundColor);
}