Извлечь текст из PDF в Rust

Как извлечь текст из PDF с помощью Rust via C++

Как извлечь текст из PDF с помощью файла Aspose.PDF для Rust via C++

Вам нужно проанализировать PDF? Программа Aspose.PDF для Rust с помощью C++ помогает извлекать текст из PDF-документов. Для извлечения мы будем использовать Aspose.PDF для Rust через C++, который представляет собой простой и безопасный набор инструментов для работы с PDF-файлами. Чтобы установить и использовать Aspose.PDF for Go через C++, нажмите кнопку «Загрузить».

Извлечь текст из PDF в Rust


Чтобы опробовать код в своей среде, вам нужно Aspose.PDF для Rust через C++.

  1. Загрузите PDF-файл вместе с экземпляром документа.
  2. Создайте объект TextAbsorber для извлечения текста.
  3. Примите абсорбер для всех страниц.
  4. Получите извлеченный текст
  5. Создайте писателя и откройте файл, напишите в файл строку текста

Извлеките текст из PDF с помощью Rust

В этом примере кода показано, как извлекать текст из PDF-документов

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

Об API Aspose.PDF for Rust via C++

Наша библиотека.NET может объединить документ из любого поддерживаемого формата загрузки в любой поддерживаемый формат сохранения. Библиотека Aspose.PDF для .NET предоставляет довольно универсальные решения, которые помогут вам решить задачи объединения документов. Aspose.PDF поддерживает самое значительное количество популярных форматов документов, как для загрузки, так и для сохранения. Обращаем ваше внимание на то, что в данном разделе описаны только популярные слияния. На текущей странице представлена информация о слиянии TEXT с {{FILERESULT}}. Однако существует множество комбинаций для объединения файлов. Полный список поддерживаемых форматов см. в разделе Поддерживаемые форматы файлов.