Ekstrak teks dari PDF di PHP

Cara Mengekstrak teks dari PDF menggunakan PHP via Java

Cara mengekstrak teks dari PDF menggunakan Aspose.PDF untuk PHP via Java

Untuk mengekstrak file PDF teks, kita akan menggunakan Aspose.PDF for .NET API yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform php-java. Buka manajer paket NuGet, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Package Manager Console.

Ekstrak teks dari PDF di PHP


Anda memerlukan Aspose.PDF library untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dengan instance Dokumen.
  2. Buat objek TextBsorber untuk mengekstrak teks.
  3. Terima absorber untuk semua halaman.
  4. Dapatkan teks yang diekstraksi
  5. Buat penulis dan buka file, tulis baris teks ke file

Ekstrak teks dari PDF dengan PHP

Kode contoh ini menunjukkan cara mengekstrak teks dari dokumen PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Tentang API Aspose.PDF for PHP via Java

Perpustakaan .NET kami dapat menggabungkan dokumen dari format unduhan yang didukung ke format penyimpanan yang didukung. Aspose.PDF untuk perpustakaan .NET menyediakan solusi yang cukup universal yang akan membantu Anda menyelesaikan tugas penggabungan dokumen. Aspose.PDF mendukung jumlah format dokumen populer yang paling signifikan, baik untuk memuat dan menyimpan. Tarik perhatian Anda pada fakta bahwa bagian saat ini hanya menjelaskan penggabungan populer. Halaman saat ini menyediakan informasi tentang penggabungan TEXT ke {{FILERESULT}}. Namun, ada banyak kombinasi untuk menggabungkan file Anda. Untuk daftar lengkap format yang didukung, lihat bagian Format File yang Didukung.