HTML JPG OCR XML BMP
Aspose.OCR  Java용
DOCX

자바용 Aspose.Imaging

스캔한 이미지나 스마트폰 사진까지 BMP 형식으로 처리하고 인식된 텍스트가 포함된 BMP 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.

Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCR과 몇 줄의 코드만으로 BMP 이미지를 DOCX 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.

  • AsposeOcr 클래스의 인스턴스 생성
  • AsposeOCR.RecognizePage 메서드 호출
  • BMP 파일 경로를 매개변수로 전달
  • AsposeOCR.RecognizePage는 DOCX 유형의 문자열 또는 파일을 반환합니다.

시스템 요구 사항

예제를 실행하기 전에 J2SE(Java 2 Platform, Standard Edition) 6.0(1.6) 이상이 시스템에 설치되어 있는지 확인하십시오.

  • JDK 1.6 이상이 설치되어 있습니다.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • BMP 무엇인가요 BMP 파일 형식

    확장자가 .BMP인 파일은 비트맵 디지털 이미지를 저장하는 데 사용되는 비트맵 이미지 파일을 나타냅니다. 이러한 이미지는 그래픽 어댑터와 무관하며 DIB(장치 독립 비트맵) 파일 형식이라고도 합니다. 이 독립성은 Microsoft Windows 및 Mac과 같은 여러 플랫폼에서 파일을 여는 목적을 제공합니다. BMP 파일 형식은 데이터를 흑백 및 다양한 색상 깊이의 색상 형식으로 2차원 디지털 이미지로 저장할 수 있습니다.

    더 읽어보기

    DOCX 무엇인가요 DOCX 파일 형식

    DOCX는 Microsoft Word 문서용으로 잘 알려진 형식입니다. Microsoft Office 2007 릴리스와 함께 2007년부터 도입된 이 새로운 문서 형식의 구조는 일반 바이너리에서 XML과 바이너리 파일의 조합으로 변경되었습니다. Docx 파일은 Word 2007 및 측면 버전에서 열 수 있지만 DOC 파일 확장자를 지원하는 이전 버전의 MS Word에서는 열 수 없습니다.

    더 읽어보기

    TXT (텍스트 문서 파일)
    Text (텍스트 문서 파일)
    DOC (Microsoft Word에서 생성한 문서)
    DOCX (마이크로소프트 워드 문서)
    XLS (Microsoft Excel 이진 파일 형식)
    XLSX (마이크로소프트 엑셀 문서)
    PDF (휴대용 문서 형식(PDF))
    Searchable PDF (검색 가능한 휴대용 네트워크 그래픽)
    XML (확장 가능한 마크업 언어)
    JSON (자바스크립트 객체 표기법)