Go の PDF からテキストを抽出

Go を使って PDF からテキストを抽出する方法

C# Java C++ Python

Go via C++ の Aspose.PDF を使って PDF からテキストを抽出する方法

PDF を解析する必要がありますか?C++ 経由の Go 用 Aspose.PDF は PDF ドキュメントからテキストを抽出するのに役立ちます。抽出を行うには、Aspose.PDF for Go via C++ を使用します。これは PDF を扱うための簡単で安全なツールキットです。C++ 経由で Aspose.PDF for Go をインストールして使用するには、Go 用 Aspose.PDF をダウンロードをクリックします。

Go の PDF からテキストを抽出

ご使用の環境でコードを試すには、C++ 経由の Go 用 Aspose.PDF が必要です。

PDF に Document のインスタンスをロードします。
TextAbSorber オブジェクトを作成してテキストを抽出します。
すべてのページにアブソーバーを取り付けてください。
抽出したテキストを取得
ライターを作成してファイルを開き、そのファイルにテキストを 1 行書き込む

Go を使って PDF からテキストを抽出する

このサンプルコードは、PDF ドキュメントからテキストを抽出する方法を示しています。

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

    package main

    import "github.com/aspose-pdf/aspose-pdf-go-cpp"
    import "log"
    import "fmt"

    func main() {
        // Open(filename string) opens a PDF-document with filename
        pdf, err := asposepdf.Open("sample.pdf")
        if err != nil {
            log.Fatal(err)

        }
        // ExtractText() returns PDF-document contents as plain text
        txt, err := pdf.ExtractText()
        if err != nil {
            log.Fatal(err)
        }
        // Print
        fmt.Println("Extracted text:\n", txt)
        // Close() releases allocated resources for PDF-document
        defer pdf.Close()
    }

Aspose.PDF for Go via C++ API について

.NET ライブラリでは、サポートされている任意のダウンロード形式のドキュメントを、サポートされている任意の保存形式に結合できます。Aspose.PDF for .NET ライブラリには、文書結合のタスクを解決するのに役立つ、かなり汎用的なソリューションが用意されています。Aspose.PDF は、ロードと保存の両方で、最も一般的なドキュメントフォーマットを多数サポートしています。現在のセクションでは一般的なマージについてのみ説明していることに注意してください。現在のページには、TEXT から {{FILERESULT}} へのマージに関する情報が掲載されています。ただし、ファイルのマージにはさまざまな組み合わせがあります。サポートされている形式の完全なリストについては、サポートされているファイル形式のセクションを参照してください。