스캔한 이미지나 스마트폰 사진까지 PDF 형식으로 처리하고 인식된 텍스트가 포함된 PDF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.
Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
C++ OCR과 몇 줄의 코드만 있으면 PDF 이미지를 Text 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.
- AsposeOcr 클래스의 인스턴스 생성
- AsposeOCR.asposeocr_page() 메서드 호출
- PDF 파일 경로를 매개변수로 전달
- AsposeOCR.asposeocr_page는 Text 유형의 문자열 또는 파일을 반환합니다.
시스템 요구 사항
예제를 실행하기 전에 Microsoft.ML.OnnxRuntime 1.7.0 이상이 프로젝트에 추가되었는지 확인하십시오. NuGet 패키지 관리자를 통해 Aspose.OCR을 설치하면 자동으로 설치됩니다.
- NET Standard 2.0+ 호환 솔루션
- 프로젝트에서 참조되는 .NET용 Aspose.OCR.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
PDF 무엇인가요 PDF 파일 형식
PDF(Portable Document Format)는 1990년대에 Adobe에서 만든 문서 유형입니다. 이 파일 형식의 목적은 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 형식으로 문서 및 기타 참조 자료를 표시하기 위한 표준을 도입하는 것입니다. PDF 파일 형식에는 원본 문서의 일부가 될 수 있는 텍스트, 이미지, 하이퍼링크, 양식 필드, 리치 미디어, 디지털 서명, 첨부 파일, 메타데이터, 지리 공간 기능 및 3D 개체와 같은 정보를 포함할 수 있는 모든 기능이 있습니다.
더 읽어보기Text 무엇인가요 Text 파일 형식
.TXT 확장자를 가진 파일은 라인 형태의 일반 텍스트를 포함하는 텍스트 문서를 나타냅니다. 텍스트 문서의 단락은 캐리지 리턴으로 인식되며 파일 내용을 더 잘 정렬하는 데 사용됩니다. 표준 텍스트 문서는 다른 운영 체제의 모든 텍스트 편집기 또는 워드 프로세싱 응용 프로그램에서 열 수 있습니다. 이러한 파일에 포함된 모든 텍스트는 사람이 읽을 수 있는 형식이며 일련의 문자로 표시됩니다.
더 읽어보기