Ekstrak teks dari PDF di Rust

Cara Mengekstrak teks dari PDF menggunakan Rust via C++

Cara mengekstrak teks dari PDF menggunakan Aspose.PDF untuk Rust via C++

Apakah Anda perlu mengurai PDF? Aspose.PDF untuk Rust melalui C++ membantu mengekstrak teks dari dokumen PDF. Untuk melakukan ekstraksi, kita akan menggunakan Aspose.PDF for Rust via C++, yang merupakan toolkit yang mudah dan aman untuk bekerja dengan PDF. Untuk menginstal dan menggunakan Aspose.PDF untuk Go via C++, klik tombol Unduh.

Ekstrak teks dari PDF di Rust


Anda memerlukan Aspose.PDF for Rust via C++ untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dengan instance Dokumen.
  2. Buat objek TextBsorber untuk mengekstrak teks.
  3. Terima absorber untuk semua halaman.
  4. Dapatkan teks yang diekstraksi
  5. Buat penulis dan buka file, tulis baris teks ke file

Ekstrak teks dari PDF dengan Rust

Kode contoh ini menunjukkan cara mengekstrak teks dari dokumen PDF

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

Tentang API Aspose.PDF for Rust via C++

Perpustakaan .NET kami dapat menggabungkan dokumen dari format unduhan yang didukung ke format penyimpanan yang didukung. Aspose.PDF untuk perpustakaan .NET menyediakan solusi yang cukup universal yang akan membantu Anda menyelesaikan tugas penggabungan dokumen. Aspose.PDF mendukung jumlah format dokumen populer yang paling signifikan, baik untuk memuat dan menyimpan. Tarik perhatian Anda pada fakta bahwa bagian saat ini hanya menjelaskan penggabungan populer. Halaman saat ini menyediakan informasi tentang penggabungan TEXT ke {{FILERESULT}}. Namun, ada banyak kombinasi untuk menggabungkan file Anda. Untuk daftar lengkap format yang didukung, lihat bagian Format File yang Didukung.