Ekstrak data dari Formulir PDF melalui Python

Ekstrak bidang data pengguna dari dokumen PDF yang dapat diisi melalui Python. Buat aplikasi Python for .NET Anda sendiri menggunakan API sisi server.

Cara Mengekstrak data dari Formulir PDF menggunakan Python for .NET Library

Untuk mengekstrak data dari Formulir PDF (Acroforms) dalam file PDF, kita akan menggunakan API Aspose.PDF for .NET, yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform python-net. Anda dapat mengunduh versi terbarunya langsung dari manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Cara Mengekstrak AcroForm dalam PDF menggunakan Python


Anda perlu Aspose.PDF for .NET untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dalam sebuah instance dari kelas Document.
  2. Dapatkan nilai dari semua bidang menggunakan Document.Form kelas.
  3. Analisis nama dan nilai jika diperlukan.
  4. Muat PDF dalam sebuah instance dari kelas Document
  5. Dapatkan nilai dari semua bidang menggunakan Document.Form kelas

Ekstrak data dari Formulir PDF - Python

Kode contoh ini menunjukkan cara Mengekstrak data dari Formulir PDF dalam PDF menggunakan Python

    // Open document
    Document pdfDocument = new Document(dataDir + "GetValuesFromAllFields.pdf");

    // Get values from all fields
    foreach (Field formField in pdfDocument.Form)
    {
        // Analyze names and values if need
        Console.WriteLine("Field Name : {0} ", formField.PartialName);
        Console.WriteLine("Value : {0} ", formField.Value);
    }