Extraia texto do PDF em Rust

Como extrair texto de um PDF usando Rust via C++

Como extrair texto de um PDF usando o Aspose.PDF para Rust via C++

Você precisa analisar o PDF? O Aspose.PDF para Rust via C++ ajuda a extrair texto de documentos PDF. Para realizar a extração, usaremos Aspose.PDF for Rust via C++, que é um kit de ferramentas fácil e seguro para trabalhar com PDFs. Para instalar e usar o Aspose.PDF para Go via C++, clique no botão Download.

Extraia texto do PDF em Rust


Você precisa de Aspose.PDF for Rust via C++ para testar o código em seu ambiente.

  1. Carregue o PDF com uma instância do Document.
  2. Crie o objeto TextAbsorber para extrair texto.
  3. Aceite o absorvedor para todas as páginas.
  4. Obtenha o texto extraído
  5. Crie um escritor e abra o arquivo, escreva uma linha de texto no arquivo

Extraia texto do PDF com Rust

Este código de exemplo mostra como extrair texto de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

Sobre o Aspose.PDF for a API Rust

Nossa biblioteca.NET pode combinar um documento de qualquer formato de download compatível com qualquer formato de salvamento suportado. A biblioteca Aspose.PDF for o.NET fornece soluções bastante universais que ajudarão você a resolver as tarefas de mesclar documentos. O Aspose.PDF suporta o número mais significativo de formatos de documentos populares, tanto para carregar quanto para salvar. Chame sua atenção para o fato de que a seção atual descreve apenas mesclagens populares. A página atual fornece informações sobre a fusão de TEXT com {{FILERESULT}}. No entanto, existem muitas combinações para mesclar seus arquivos. Para obter uma lista completa dos formatos suportados, consulte a seção Formatos de arquivo suportados.