PDF’yi PHP aracılığıyla ayıklayın

PHP via Java Kütüphane Kullanarak PDF’den metin ve görüntü ayıklama

Parser ile en popüler eylem

PDF PHP via Java Kitaplığı ile nasıl ayrıştırılır

PDF dosyalarını ayıklamak için php-java platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan Aspose.PDF for .NET API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.pdf öğesini arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.

PDF’yi PHP aracılığıyla ayrıştırın


Ortamınızdaki kodu denemek için Aspose.PDF library gerekir.

  1. PDF’yi bir Document örneğiyle yükleyin.
  2. Metin ayıklamak için bir TextAbSorber nesnesi oluşturun.
  3. Tüm sayfalar için emiciyi kabul edin.
  4. Çıkarılan metni alın
  5. Bir yazar oluşturun ve dosyayı açın, dosyaya bir satır metin yazın

PDF Dosyalarını Ayıkla - PHP

Bu örnek kod, PDF belgelerinin nasıl çıkarılacağını gösterir

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Aspose.PDF for PHP via Java API'si Hakkında

.NET Kütüphanemiz, desteklenen herhangi bir indirme biçimindeki bir belgeyi desteklenen herhangi bir kaydetme biçimiyle birleştirebilir. .NET kütüphanesi için Aspose.PDF, belgeleri birleştirme görevlerini çözmenize yardımcı olacak oldukça evrensel çözümler sunar. Aspose.PDF, hem yükleme hem de kaydetme için en önemli sayıda popüler belge biçimini destekler. Mevcut bölümün yalnızca popüler birleşmeleri tanımladığı gerçeğine dikkatinizi çekin. Geçerli sayfa {{FILETYPE}} ile {{FILERESULT}} birleştirilmesi hakkında bilgi sağlar. Ancak, dosyalarınızı birleştirmek için birçok kombinasyon vardır. Desteklenen formatların tam listesi için [Desteklenen Dosya Biçimleri] bölümüne bakın (https://docs.aspose.com/pdf/net/supported-file-formats/).