Go 에서 PDF에서 텍스트 추출

Go via C++ 을 사용하여 PDF에서 텍스트를 추출하는 방법

Go via C++ 용 Aspose.PDF 파일을 사용하여 PDF에서 텍스트를 추출하는 방법

PDF를 파싱해야 하나요?Go via C++용 Aspose.PDF 파일은 PDF 문서에서 텍스트를 추출하는 데 도움이 됩니다.추출을 수행하기 위해 PDF 작업에 사용되는 쉽고 안전한 툴킷인 Aspose.PDF for Go via C++ 을 사용하겠습니다.C++를 통해 Go용 Aspose.PDF 버전을 설치하여 사용하려면 Go용 Aspose.PDF 다운로드 를 클릭하십시오.

Go 에서 PDF에서 텍스트 추출


사용자 환경에서 코드를 테스트하려면 Aspose.PDF for Go via C++ 이 필요합니다.

  1. 문서 인스턴스와 함께 PDF를 로드합니다.
  2. 텍스트를 추출하는 TextAbsorber 객체를 생성합니다.
  3. 모든 페이지에 흡수 장치를 사용하십시오.
  4. 추출된 텍스트 가져오기
  5. 라이터 생성 및 파일 열기, 파일에 텍스트 한 줄 쓰기

Go 를 사용하여 PDF에서 텍스트 추출

이 샘플 코드는 PDF 문서에서 텍스트를 추출하는 방법을 보여줍니다.

Input file:

File not added

Output format:

PDF

Output file:


    package main

    import "github.com/aspose-pdf/aspose-pdf-go-cpp"
    import "log"
    import "fmt"

    func main() {
        // Open(filename string) opens a PDF-document with filename
        pdf, err := asposepdf.Open("sample.pdf")
        if err != nil {
            log.Fatal(err)

        }
        // ExtractText() returns PDF-document contents as plain text
        txt, err := pdf.ExtractText()
        if err != nil {
            log.Fatal(err)
        }
        // Print
        fmt.Println("Extracted text:\n", txt)
        // Close() releases allocated resources for PDF-document
        defer pdf.Close()
    }

Aspose.PDF for Go via C++ API에 대하여

.NET 라이브러리는 지원되는 모든 다운로드 형식의 문서를 지원되는 저장 형식으로 결합할 수 있습니다..NET 라이브러리용 Aspose.PDF 라이브러리는 문서 병합 작업을 해결하는 데 도움이 되는 상당히 보편적인 솔루션을 제공합니다.Aspose.PDF 로딩 및 저장에 가장 많이 사용되는 문서 형식을 지원합니다.현재 섹션에서는 자주 사용되는 병합에 대해서만 설명한다는 점에 유의하세요.현재 페이지에서는 TEXT 를 {{FILERESULT}} 에 병합하는 방법에 대한 정보를 제공합니다.하지만 파일을 병합할 수 있는 여러 가지 조합이 있습니다.지원되는 형식의 전체 목록은 지원되는 파일 형식 섹션을 참조하십시오.