스캔한 이미지나 스마트폰 사진까지 DJVU 형식으로 처리하고 인식된 텍스트가 포함된 DJVU 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.
Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
C++ OCR과 몇 줄의 코드만 있으면 DJVU 이미지를 DOCX 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.
- AsposeOcr 클래스의 인스턴스 생성
- AsposeOCR.asposeocr_page() 메서드 호출
- DJVU 파일 경로를 매개변수로 전달
- AsposeOCR.asposeocr_page는 DOCX 유형의 문자열 또는 파일을 반환합니다.
시스템 요구 사항
예제를 실행하기 전에 Microsoft.ML.OnnxRuntime 1.7.0 이상이 프로젝트에 추가되었는지 확인하십시오. NuGet 패키지 관리자를 통해 Aspose.OCR을 설치하면 자동으로 설치됩니다.
- NET Standard 2.0+ 호환 솔루션
- 프로젝트에서 참조되는 .NET용 Aspose.OCR.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
DJVU 무엇인가요 DJVU 파일 형식
"déjà vu"로 발음되는 DjVu는 특히 텍스트, 그림, 이미지 및 사진의 조합이 포함된 스캔 문서 및 책을 위한 그래픽 파일 형식입니다. AT&T Labs에서 개발했습니다. 텍스트 및 배경 이미지의 이미지 레이어 분리, 프로그레시브 로딩, 산술 코딩 및 비트 이미지에 대한 손실 압축과 같은 여러 기술을 사용합니다. DJVU 파일은 압축된 고품질의 컬러 이미지, 사진, 텍스트, 그림 등을 담을 수 있어 적은 공간에 저장할 수 있어 웹상에서 eBook, 매뉴얼, 신문, 고대문서 등으로 활용되고 있습니다.
더 읽어보기DOCX 무엇인가요 DOCX 파일 형식
DOCX는 Microsoft Word 문서용으로 잘 알려진 형식입니다. Microsoft Office 2007 릴리스와 함께 2007년부터 도입된 이 새로운 문서 형식의 구조는 일반 바이너리에서 XML과 바이너리 파일의 조합으로 변경되었습니다. Docx 파일은 Word 2007 및 측면 버전에서 열 수 있지만 DOC 파일 확장자를 지원하는 이전 버전의 MS Word에서는 열 수 없습니다.
더 읽어보기