Wyodrębnij tekst z pliku PDF w Rust

Jak wyodrębnić tekst z pliku PDF za pomocą Rust via C++

Jak wyodrębnić tekst z pliku PDF za pomocą Aspose.PDF dla Rust via C++

Czy musisz analizować plik PDF? Plik Aspose.PDF dla Rust przez C++ pomaga wyodrębnić tekst z dokumentów PDF. Aby wykonać ekstrakcję, użyjemy Aspose.PDF for Rust via C++, który jest łatwym i bezpiecznym zestawem narzędzi do pracy z plikami PDF. Aby zainstalować i używać Aspose.PDF dla Go via C++, kliknij przycisk Pobierz.

Wyodrębnij tekst z pliku PDF w Rust


Potrzebujesz Aspose.PDF dla Rust przez C++, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF z instancją dokumentu.
  2. Utwórz obiekt TextTabSorber, aby wyodrębnić tekst.
  3. Zaakceptuj absorber dla wszystkich stron.
  4. Pobierz wyodrębniony tekst
  5. Utwórz pisarza i otwórz plik, napisz wiersz tekstu do pliku

Wyodrębnij tekst z pliku PDF za pomocą Rust

Ten przykładowy kod pokazuje, jak wyodrębnić tekst z dokumentów PDF

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

Informacje o Aspose.PDF for Rust via C++ API

Nasza Biblioteka.NET może łączyć dokument z dowolnego obsługiwanego formatu pobierania z dowolnym obsługiwanym formatem zapisu. Aspose.PDF dla biblioteki.NET zapewnia dość uniwersalne rozwiązania, które pomogą Ci rozwiązać zadania scalania dokumentów. Aspose.PDF obsługuje największą liczbę popularnych formatów dokumentów, zarówno do ładowania, jak i zapisywania. Zwróć uwagę na fakt, że obecna sekcja opisuje tylko popularne połączenia. Bieżąca strona zawiera informacje o scalaniu TEXT z {{FILERESSULT}}. Istnieje jednak wiele kombinacji do łączenia plików. Pełną listę obsługiwanych formatów można znaleźć w sekcji Obsługiwane formaty plików.