HTML JPG OCR XML BMP
Aspose.OCR  C++용
DOC

자바용 Aspose.Imaging

스캔한 이미지나 스마트폰 사진까지 PDF 형식으로 처리하고 인식된 텍스트가 포함된 PDF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.

Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

C++ OCR과 몇 줄의 코드만 있으면 PDF 이미지를 DOC 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.

  • AsposeOcr 클래스의 인스턴스 생성
  • AsposeOCR.asposeocr_page() 메서드 호출
  • PDF 파일 경로를 매개변수로 전달
  • AsposeOCR.asposeocr_page는 DOC 유형의 문자열 또는 파일을 반환합니다.

시스템 요구 사항

예제를 실행하기 전에 Microsoft.ML.OnnxRuntime 1.7.0 이상이 프로젝트에 추가되었는지 확인하십시오. NuGet 패키지 관리자를 통해 Aspose.OCR을 설치하면 자동으로 설치됩니다.

  • NET Standard 2.0+ 호환 솔루션
  • 프로젝트에서 참조되는 .NET용 Aspose.OCR.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • PDF 무엇인가요 PDF 파일 형식

    PDF(Portable Document Format)는 1990년대에 Adobe에서 만든 문서 유형입니다. 이 파일 형식의 목적은 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 형식으로 문서 및 기타 참조 자료를 표시하기 위한 표준을 도입하는 것입니다. PDF 파일 형식에는 원본 문서의 일부가 될 수 있는 텍스트, 이미지, 하이퍼링크, 양식 필드, 리치 미디어, 디지털 서명, 첨부 파일, 메타데이터, 지리 공간 기능 및 3D 개체와 같은 정보를 포함할 수 있는 모든 기능이 있습니다.

    더 읽어보기

    DOC 무엇인가요 DOC 파일 형식

    확장자가 .doc인 파일은 Microsoft Word 또는 기타 워드 프로세싱 문서에서 생성된 문서를 바이너리 파일 형식으로 나타냅니다. 확장은 처음에 여러 운영 체제의 일반 텍스트 문서에 사용되었습니다. 여기에는 이미지, 서식이 지정된 일반 텍스트, 그래프, 차트, 포함된 개체, 링크, 페이지, 페이지 서식, 인쇄 설정 및 기타 여러 유형의 데이터가 포함될 수 있습니다. 이 형식은 매뉴얼, 제안서, 사양, 이력서, 기사 또는 유사한 문서 작성을 위해 사용자에게 제공하는 다양한 옵션으로 인해 모든 종류의 문서에 널리 사용되었습니다. DOC의 업데이트된 버전은 사양이 공개적으로 제공되는 Office OpenXML을 기반으로 하는 DOCX입니다.

    더 읽어보기