以 Go 从 PDF 中提取文本

如何使用 Go via C++ 从 PDF 中提取文本

如何使用 Aspose.PDF for Go via C++ 从 PDF 中提取文本

你需要解析 PDF 吗?通过 C++ 实现 Aspose.PDF for Go 有助于从 PDF 文档中提取文本。为了进行提取,我们将使用 Aspose.PDF for Go via C++,这是一个用于处理 PDF 的简单而安全的工具包。要通过 C++ 安装和使用 Aspose.PDF for Go,请单击 下载 Aspose.PDF for Go

以 Go 从 PDF 中提取文本


你需要 Aspose.PDF for Go via C++ 才能在你的环境中试用代码。

  1. 在 PDF 中加载 “文档” 实例。
  2. 创建 textabSorber 对象来提取文本。
  3. 接受所有页面的吸收器。
  4. 获取提取的文本
  5. 创建一个写入器并打开文件,在文件中写一行文本

使用 Go 从 PDF 中提取文本

此示例代码显示如何从 PDF 文档中提取文本

Input file:

File not added

Output format:

PDF

Output file:


    package main

    import "github.com/aspose-pdf/aspose-pdf-go-cpp"
    import "log"
    import "fmt"

    func main() {
        // Open(filename string) opens a PDF-document with filename
        pdf, err := asposepdf.Open("sample.pdf")
        if err != nil {
            log.Fatal(err)

        }
        // ExtractText() returns PDF-document contents as plain text
        txt, err := pdf.ExtractText()
        if err != nil {
            log.Fatal(err)
        }
        // Print
        fmt.Println("Extracted text:\n", txt)
        // Close() releases allocated resources for PDF-document
        defer pdf.Close()
    }

关于 Aspose.PDF for Go via C++ API

我们的.NET 库可以将任何支持的下载格式的文档合并为任何支持的保存格式。.NET 的 Aspose.PDF 库提供了相当通用的解决方案,可以帮助你解决合并文档的任务。Aspose.PDF 支持最多的流行文档格式,用于加载和保存。请注意以下事实:当前部分仅描述流行的合并。当前页面提供有关将 TEXT 合并到 {{FILERESULT}} 的信息。但是,合并文件有多种组合。有关支持格式的完整列表,请参阅 支持的文件格式 部分。