PDF’yi C++ içinde ayıklayın

C++ Kütüphane Kullanarak PDF’den metin ve görüntü ayıklama

Parser ile en popüler eylem

C++ Kütüphanesi ile PDF Nasıl Çıkarılır

PDF’yi çıkarmanız mı gerekiyor? PDF belgelerinin programatik olarak değiştirilmesi, modern dijital iş akışlarının önemli bir parçasıdır. Aspose.PDF gibi C++ kütüphaneleriyle, geliştiriciler PDF’den metin çıkarabilir veya PDF’den resim çıkarabilir. Bu kütüphaneler, diğer yazılımlara dayanmayan ve ticari kullanıma hazır bağımsız çözümlerdir. Profesyonel C++ geliştiricilerinin olası tüm ihtiyaçlarını karşılar.

  • PDF verilerini ayıklayın: metinler, resimler, formlar, alanlar vb.
  • PDF’den metin ayıklayın
  • PDF’den Görüntüleri Ayıkla
  • PDF’den Yazı Tiplerini Çıkarın
  • Formdan Veri Ayıklayın
  • Pullardan Metin Ayıkla
  • Tablodan Veri Ayıkla

PDF dosyasını ayıklamak için, cpp platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan C++ için Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.pdf dosyasını arayın ve yükleyin. Package Manager Console’dan aşağıdaki komutu da kullanabilirsiniz.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

PDF’yi C++ aracılığıyla ayrıştırın


Ortamınızdaki kodu denemek için C++ için Aspose.PDF gerekir.

  1. PDF’yi bir Belge örneğiyle yükleyin.
  2. Metin ayıklamak için TexTabsorber nesnesi oluşturun.
  3. Tüm sayfalar için emiciyi kabul edin.
  4. Çıkarılan metni alın
  5. Bir yazar oluşturun ve dosyayı açın, dosyaya bir metin satırı yazın

PDF Dosyalarını Ayıkla - C++

Bu örnek kod, PDF belgelerinin nasıl çıkarılacağını gösterir

Input file:

File not added

Output format:

PDF

Output file:


    void ExtractTextFromAllThePages() {

    std::clog << __func__ << ": Start" << std::endl;
    // String for path name
    String _dataDir("C:\\Samples\\Parsing\\");

    // String for file name
    String infilename("sample-4pages.pdf");
    String outfilename("extracted-text.txt");

    // Open document
    auto document = MakeObject<Document>(_dataDir + infilename);

    // Create TextAbsorber object to extract text
    auto textAbsorber = MakeObject<TextAbsorber>();
    // Accept the absorber for all the pages
    document->get_Pages()->Accept(textAbsorber);
    // Get the extracted text
    auto extractedText = textAbsorber->get_Text();

    System::IO::File::WriteAllText(_dataDir + outfilename, extractedText);
    std::clog << __func__ << ": Finish" << std::endl;
}

C++ API için Aspose.PDF Hakkında

Aspose.PDF for C++, geliştiricilerin Adobe Acrobat kullanmadan PDF belgeleri oluşturmasını, okumasını ve değiştirmesini sağlayan güçlü bir işleme kütüphanesidir. Form oluşturma, metin ekleme/düzenleme, PDF sayfalarını değiştirme, ek açıklamalar ekleme, özel yazı tiplerini işleme ve çok daha fazlası gibi çok çeşitli özellikler sunar.

Aspose.PDF for C++, geliştiricilerin uygulamalarına PDF işleme yetenekleri eklemelerini sağlayan bir kütüphanedir. API, Adobe Acrobat kullanmadan PDF dosyalarını oluşturmak veya okumak, dönüştürmek ve işlemek için her türlü 32 bit ve 64 bit uygulama oluşturmak için kullanılabilir.

Her sınıf ve yöntem için ayrıntılı açıklama ve örnekleri C++ kütüphanesi için Aspose.PDF API referansında bulabilirsiniz. Ve ayrıca bir Dokümantasyon görüntülemenizi öneririz.