스캔한 이미지나 스마트폰 사진까지 PDF 형식으로 처리하고 인식된 텍스트가 포함된 PDF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.
Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Java OCR과 몇 줄의 코드만으로 PDF 이미지를 Searchable PDF 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.
- AsposeOcr 클래스의 인스턴스 생성
- AsposeOCR.RecognizePage 메서드 호출
- PDF 파일 경로를 매개변수로 전달
- AsposeOCR.RecognizePage는 Searchable PDF 유형의 문자열 또는 파일을 반환합니다.
시스템 요구 사항
예제를 실행하기 전에 J2SE(Java 2 Platform, Standard Edition) 6.0(1.6) 이상이 시스템에 설치되어 있는지 확인하십시오.
- JDK 1.6 이상이 설치되어 있습니다.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
PDF 무엇인가요 PDF 파일 형식
PDF(Portable Document Format)는 1990년대에 Adobe에서 만든 문서 유형입니다. 이 파일 형식의 목적은 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 형식으로 문서 및 기타 참조 자료를 표시하기 위한 표준을 도입하는 것입니다. PDF 파일 형식에는 원본 문서의 일부가 될 수 있는 텍스트, 이미지, 하이퍼링크, 양식 필드, 리치 미디어, 디지털 서명, 첨부 파일, 메타데이터, 지리 공간 기능 및 3D 개체와 같은 정보를 포함할 수 있는 모든 기능이 있습니다.
더 읽어보기Searchable PDF 무엇인가요 Searchable PDF 파일 형식
검색 가능한 PDF 파일은 문서 내에서 전체 텍스트 검색에 사용하거나 복사 및 붙여넣기 작업을 위해 텍스트를 강조 표시하는 데 사용할 수 있는 숨겨진 레이어의 OCR 텍스트뿐만 아니라 볼 수 있도록 원본 스캔 이미지를 유지합니다. 원본 이미지를 포함하지 않는 PDF로의 전체 OCR 변환은 특히 문서에 이미지가 많거나 복잡한 레이아웃이 있는 경우 원본 형식을 100% 유지하지 않습니다.
더 읽어보기