以 Rust 从 PDF 中提取文本

如何使用 Rust via C++ 从 PDF 中提取文本

如何使用 Aspose.PDF for Rust via C++ 从 PDF 中提取文本

你需要解析 PDF 吗?通过 C++ 实现 Rust 的 Aspose.PDF 有助于从 PDF 文档中提取文本。为了进行提取,我们将使用 Aspose.PDF via C++ for Rust,这是一个用于处理 PDF 的简单而安全的工具包。要通过 C++ 安装和使用 Aspose.PDF for Go,请单击 “下载” 按钮。

以 Rust 从 PDF 中提取文本


你需要 Aspose.PDF for Rust via C++ 才能在你的环境中试用代码。

  1. 在 PDF 中加载 “文档” 实例。
  2. 创建 textabSorber 对象来提取文本。
  3. 接受所有页面的吸收器。
  4. 获取提取的文本
  5. 创建一个写入器并打开文件,在文件中写一行文本

使用 Rust 从 PDF 中提取文本

此示例代码显示如何从 PDF 文档中提取文本

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

关于 Aspose.PDF for Rust via C++ API

我们的.NET 库可以将任何支持的下载格式的文档合并为任何支持的保存格式。.NET 的 Aspose.PDF 库提供了相当通用的解决方案,可以帮助你解决合并文档的任务。Aspose.PDF 支持最多的流行文档格式,用于加载和保存。请注意以下事实:当前部分仅描述流行的合并。当前页面提供有关将 TEXT 合并到 {{FILERESULT}} 的信息。但是,合并文件有多种组合。有关支持格式的完整列表,请参阅 支持的文件格式 部分。