C++ 에서 PDF에서 텍스트 추출

C++ 라이브러리를 사용하여 PDF에서 텍스트를 추출하는 방법

C++ 라이브러리를 사용하여 PDF에서 텍스트를 추출하는 방법

PDF에서 텍스트를 추출해야 합니까?PDF 문서를 프로그래밍 방식으로 수정하는 것은 현대 디지털 워크플로우의 필수적인 부분입니다.Aspose.PDF 같은 C++ 라이브러리를 사용하면 개발자가 PDF에서 텍스트를 추출할 수 있습니다.이러한 라이브러리는 다른 소프트웨어를 사용하지 않고 상업적으로 사용할 수 있는 독립 실행형 솔루션입니다.전문 C++ 개발자의 가능한 모든 요구 사항을 충족합니다.

  • PDF에서 텍스트 추출
  • PDF에서 이미지 추출
  • PDF에서 글꼴 추출
  • 양식에서 데이터 추출
  • 스탬프에서 텍스트 추출
  • 테이블에서 데이터 추출

PDF 파일에서 텍스트를 추출하기 위해 cpp 플랫폼용 기능이 풍부하고 강력하며 사용하기 쉬운 Aspose.PDF for C++ API를 사용합니다.NuGet 패키지 관리자를 열고 Aspose.pdf를 검색하여 설치합니다.패키지 관리자 콘솔에서 다음 명령을 사용할 수도 있습니다.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

C++ 에서 PDF에서 텍스트 추출


사용자 환경에서 코드를 사용해 보려면 Aspose.PDF for C++ 가 필요합니다.

1.문서 인스턴스와 함께 PDF를 로드합니다. 1.텍스트를 추출하는 TextAbsorber 객체를 생성합니다. 1.모든 페이지에 흡수 장치를 사용하십시오. 1.추출된 텍스트 가져오기 1.라이터 생성 및 파일 열기, 파일에 텍스트 한 줄 쓰기

PDF에서 텍스트 추출 - C++

이 샘플 코드는 PDF 문서에서 텍스트를 추출하는 방법을 보여줍니다.

Input file:

File not added

Output format:

PDF

Output file:


    void ExtractTextFromAllThePages() {

    std::clog << __func__ << ": Start" << std::endl;
    // String for path name
    String _dataDir("C:\\Samples\\Parsing\\");

    // String for file name
    String infilename("sample-4pages.pdf");
    String outfilename("extracted-text.txt");

    // Open document
    auto document = MakeObject<Document>(_dataDir + infilename);

    // Create TextAbsorber object to extract text
    auto textAbsorber = MakeObject<TextAbsorber>();
    // Accept the absorber for all the pages
    document->get_Pages()->Accept(textAbsorber);
    // Get the extracted text
    auto extractedText = textAbsorber->get_Text();

    System::IO::File::WriteAllText(_dataDir + outfilename, extractedText);
    std::clog << __func__ << ": Finish" << std::endl;
}

C++ API용 Aspose.PDF 정보

C++용 Aspose.PDF 는 개발자가 Adobe Acrobat을 사용하지 않고도 PDF 문서를 만들고 읽고 조작할 수 있는 강력한 처리 라이브러리입니다.양식 작성, 텍스트 추가/편집, PDF 페이지 조작, 주석 추가, 사용자 정의 글꼴 처리 등과 같은 다양한 기능을 제공합니다.

C++용 Aspose.PDF 는 개발자가 자신의 응용 프로그램에 PDF 처리 기능을 추가할 수 있게 해주는 라이브러리입니다.API를 사용하여 Adobe Acrobat을 사용하지 않고도 PDF 파일을 생성, 읽기, 변환 및 조작할 수 있는 32비트 및 64비트 응용 프로그램을 구축할 수 있습니다.

API 레퍼런스에서 C++용 Aspose.PDF 라이브러리 의 모든 클래스 및 메서드에 대한 자세한 설명과 예제를 찾을 수 있습니다.또한 문서 를 보는 것도 좋습니다.