C++ 에서 PDF 추출

C++ 라이브러리를 사용하여 PDF에서 텍스트 및 이미지를 추출하는 방법

파서에서 가장 많이 사용되는 액션

C++ 라이브러리를 사용하여 PDF를 추출하는 방법

PDF를 추출해야 합니까?PDF 문서의 프로그래밍 방식 수정은 현대 디지털 워크플로우의 필수적인 부분입니다.개발자는 Aspose.PDF 같은 C++ 라이브러리를 사용하여 PDF에서 텍스트를 추출하거나 PDF에서 이미지를 추출할 수 있습니다.이러한 라이브러리는 다른 소프트웨어를 사용하지 않고 상업적으로 사용할 수 있는 독립 실행형 솔루션입니다.전문 C++ 개발자의 가능한 모든 요구 사항을 충족합니다.

  • PDF 데이터 추출: 텍스트, 이미지, 양식, 필드 등
  • PDF에서 텍스트 추출
  • PDF에서 이미지 추출
  • PDF에서 글꼴 추출
  • 양식에서 데이터 추출
  • 스탬프에서 텍스트 추출
  • 테이블에서 데이터 추출

PDF 파일을 추출하기 위해 cpp 플랫폼을 위한 풍부하고 강력하며 사용하기 쉬운 문서 조작 API인 Aspose.PDF for C++ API를 사용할 것입니다.NuGet 패키지 관리자를 열고 Aspose.pdf를 검색하여 설치합니다.패키지 관리자 콘솔에서 다음 명령을 사용할 수도 있습니다.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

C++ 를 통해 PDF 구문 분석


사용자 환경에서 코드를 테스트하려면 Aspose.PDF for C++ 가 필요합니다.

1.문서 인스턴스와 함께 PDF를 로드합니다. 1.텍스트를 추출하는 TextAbsorber 객체를 만듭니다. 1.모든 페이지의 업소버를 수락하십시오. 1.추출된 텍스트 가져오기 1.작성기를 만들고 파일을 열고 파일에 한 줄의 텍스트를 씁니다.

PDF 파일 추출 - C++

이 샘플 코드는 PDF 문서를 추출하는 방법을 보여줍니다.

Input file:

File not added

Output format:

PDF

Output file:


    void ExtractTextFromAllThePages() {

    std::clog << __func__ << ": Start" << std::endl;
    // String for path name
    String _dataDir("C:\\Samples\\Parsing\\");

    // String for file name
    String infilename("sample-4pages.pdf");
    String outfilename("extracted-text.txt");

    // Open document
    auto document = MakeObject<Document>(_dataDir + infilename);

    // Create TextAbsorber object to extract text
    auto textAbsorber = MakeObject<TextAbsorber>();
    // Accept the absorber for all the pages
    document->get_Pages()->Accept(textAbsorber);
    // Get the extracted text
    auto extractedText = textAbsorber->get_Text();

    System::IO::File::WriteAllText(_dataDir + outfilename, extractedText);
    std::clog << __func__ << ": Finish" << std::endl;
}

C++ API용 Aspose.PDF 정보

C++용 Aspose.PDF 는 개발자가 Adobe Acrobat을 사용하지 않고도 PDF 문서를 만들고 읽고 조작할 수 있게 해주는 강력한 처리 라이브러리입니다.양식 작성, 텍스트 추가/편집, PDF 페이지 조작, 주석 추가, 사용자 정의 글꼴 처리 등과 같은 다양한 기능을 제공합니다.

C++용 Aspose.PDF 는 개발자가 응용 프로그램에 PDF 처리 기능을 추가할 수 있게 해주는 라이브러리입니다.API를 사용하면 Adobe Acrobat을 사용하지 않고도 PDF 파일을 생성하거나 읽고, 변환하고, 조작할 수 있는 모든 유형의 32비트 및 64비트 응용 프로그램을 구축할 수 있습니다.

API 레퍼런스의 C++용 Aspose.PDF 라이브러리 에서 모든 클래스 및 메서드에 대한 자세한 설명과 예제를 찾을 수 있습니다.또한 설명서 를 보는 것도 좋습니다.