Python aracılığıyla PDF Formlarından veri ayıklayın

Doldurulabilir PDF belgesinden kullanıcı veri alanlarını ayıklayın. PDF dosyalarını programlı olarak değiştirmek için Python for .NET için Aspose.PDF dosyasını kullanın

Python for .NET Kütüphanesini kullanarak PDF Formlarından Veri Çıkarma

Bir PDF dosyasındaki PDF Formlarından (Acroforms) veri ayıklamak için python-net platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay belge işleme API’si olan .NET için Aspose.PDF API’sini kullanacağız. En son sürümünü doğrudan NuGet paket yöneticisinden indirebilir, ASPOSE.PDF arayabilir ve yükleyebilirsiniz. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.

Python kullanarak PDF’de AcroForm Nasıl Çıkarılır


Kodu ortamınızda denemek için Aspose.PDF for .NET gerekir.

  1. PDF’yi Document sınıfının bir örneğinde yükleyin.
  2. Document.Form sınıfını kullanarak tüm alanlardan değerler alın.
  3. Gerekirse isimleri ve değerleri analiz edin.
  4. Document sınıfı örneğinde PDF’yi yükleme
  5. Document.Form sınıfını kullanarak tüm alanlardan değer alın

PDF Formlarından veri ayıklayın - Python

Bu örnek kod, Python kullanarak PDF'deki PDF Formlarından verilerin nasıl çıkarılacağını gösterir

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)