Extrahieren Sie Text aus PDF in Rust

So extrahieren Sie Text aus einer PDF-Datei mit Rust via C++

So extrahieren Sie Text aus einem PDF mit Aspose.PDF für Rust via C++

Müssen Sie PDF analysieren? Die Aspose.PDF für Rust via C++ hilft beim Extrahieren von Text aus PDF-Dokumenten. Um die Extraktion durchzuführen, verwenden wir Aspose.PDF for Rust via C++, ein einfaches und sicheres Toolkit für die Arbeit mit PDFs. Um Aspose.PDF for Go via C++ zu installieren und zu verwenden, klicken Sie auf die Schaltfläche Herunterladen.

Extrahieren Sie Text aus PDF in Rust


Sie benötigen Aspose.PDF for Rust via C++, um den Code in Ihrer Umgebung auszuprobieren.

  1. Laden Sie das PDF mit einer Instanz von Document.
  2. Erstellen Sie ein TextAbsorber-Objekt, um Text zu extrahieren.
  3. Akzeptiere den Absorber für alle Seiten.
  4. Holen Sie sich den extrahierten Text
  5. Erstellen Sie einen Writer und öffnen Sie die Datei, schreiben Sie eine Textzeile in die Datei

Extrahieren Sie Text aus PDF mit Rust

Dieser Beispielcode zeigt, wie Text aus PDF-Dokumenten extrahiert wird

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

Über Aspose.PDF for Rust via C++ API

Unsere .NET-Bibliothek kann ein Dokument aus jedem unterstützten Download-Format mit jedem unterstützten Speicherformat kombinieren. Aspose.PDF for .NET Library bietet ziemlich universelle Lösungen, mit denen Sie die Aufgaben beim Zusammenführen von Dokumenten lösen können. Aspose.PDF unterstützt die meisten gängigen Dokumentformate, sowohl zum Laden als auch zum Speichern. Machen Sie darauf aufmerksam, dass im aktuellen Abschnitt nur beliebte Zusammenführungen beschrieben werden. Die aktuelle Seite enthält Informationen zum Zusammenführen von TEXT mit {{FILERESULT}}. Es gibt jedoch viele Kombinationen für das Zusammenführen Ihrer Dateien. Eine vollständige Liste der unterstützten Formate finden Sie im Abschnitt Unterstützte Dateiformate.