스캔한 이미지나 스마트폰 사진까지 DJVU 형식으로 처리하고 인식된 텍스트가 포함된 DJVU 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.
Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Java OCR과 몇 줄의 코드만으로 DJVU 이미지를 XML 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.
- AsposeOcr 클래스의 인스턴스 생성
- AsposeOCR.RecognizePage 메서드 호출
- DJVU 파일 경로를 매개변수로 전달
- AsposeOCR.RecognizePage는 XML 유형의 문자열 또는 파일을 반환합니다.
시스템 요구 사항
예제를 실행하기 전에 J2SE(Java 2 Platform, Standard Edition) 6.0(1.6) 이상이 시스템에 설치되어 있는지 확인하십시오.
- JDK 1.6 이상이 설치되어 있습니다.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
DJVU 무엇인가요 DJVU 파일 형식
"déjà vu"로 발음되는 DjVu는 특히 텍스트, 그림, 이미지 및 사진의 조합이 포함된 스캔 문서 및 책을 위한 그래픽 파일 형식입니다. AT&T Labs에서 개발했습니다. 텍스트 및 배경 이미지의 이미지 레이어 분리, 프로그레시브 로딩, 산술 코딩 및 비트 이미지에 대한 손실 압축과 같은 여러 기술을 사용합니다. DJVU 파일은 압축된 고품질의 컬러 이미지, 사진, 텍스트, 그림 등을 담을 수 있어 적은 공간에 저장할 수 있어 웹상에서 eBook, 매뉴얼, 신문, 고대문서 등으로 활용되고 있습니다.
더 읽어보기XML 무엇인가요 XML 파일 형식
XML은 Extensible Markup Language의 약자로서 HTML과 유사하지만 객체를 정의하기 위한 태그를 사용한다는 점에서 다릅니다. XML 파일 형식 생성의 배경은 소프트웨어나 하드웨어 도구에 의존하지 않고 데이터를 저장하고 전송하는 것이었습니다. 그 인기는 사람뿐만 아니라 기계가 읽을 수 있기 때문입니다. 이를 통해 WWW(월드 와이드 웹)와 같은 네트워크를 통해 저장 및 공유할 개체 형태의 공통 데이터 프로토콜을 생성할 수 있습니다. XML의 "X"는 확장 가능하므로 사용자 요구 사항에 따라 언어를 기호 수에 관계없이 확장할 수 있습니다. Microsoft Open XML, LibreOffice OpenDocument, XHTML 및 SVG와 같은 많은 표준 파일 형식에서 이러한 기능을 사용합니다.
더 읽어보기