HTML JPG OCR XML BMP
Aspose.OCR  Java용
XLS

자바용 Aspose.Imaging

스캔한 이미지나 스마트폰 사진까지 PDF 형식으로 처리하고 인식된 텍스트가 포함된 PDF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR만 있으면 됩니다.

Maven 또는 Aspose Maven Repository 구성 지정 다음 구성을 _pom.xml_에 추가하여 Maven 기반 프로젝트 내에 설치합니다. Gradle, Ivy, Sbt 예제는 repository 에서 확인하세요.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCR과 몇 줄의 코드만으로 PDF 이미지를 XLS 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.

  • AsposeOcr 클래스의 인스턴스 생성
  • AsposeOCR.RecognizePage 메서드 호출
  • PDF 파일 경로를 매개변수로 전달
  • AsposeOCR.RecognizePage는 XLS 유형의 문자열 또는 파일을 반환합니다.

시스템 요구 사항

예제를 실행하기 전에 J2SE(Java 2 Platform, Standard Edition) 6.0(1.6) 이상이 시스템에 설치되어 있는지 확인하십시오.

  • JDK 1.6 이상이 설치되어 있습니다.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • PDF 무엇인가요 PDF 파일 형식

    PDF(Portable Document Format)는 1990년대에 Adobe에서 만든 문서 유형입니다. 이 파일 형식의 목적은 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 형식으로 문서 및 기타 참조 자료를 표시하기 위한 표준을 도입하는 것입니다. PDF 파일 형식에는 원본 문서의 일부가 될 수 있는 텍스트, 이미지, 하이퍼링크, 양식 필드, 리치 미디어, 디지털 서명, 첨부 파일, 메타데이터, 지리 공간 기능 및 3D 개체와 같은 정보를 포함할 수 있는 모든 기능이 있습니다.

    더 읽어보기

    XLS 무엇인가요 XLS 파일 형식

    XLS 확장자를 가진 파일은 Excel 바이너리 파일 형식을 나타냅니다. 이러한 파일은 Microsoft Excel뿐만 아니라 OpenOffice Calc 또는 Apple Numbers와 같은 기타 유사한 스프레드시트 프로그램에서 생성할 수 있습니다. Excel에서 저장한 파일을 통합 문서라고 하며 각 통합 문서에는 하나 이상의 워크시트가 있을 수 있습니다. 데이터는 워크시트의 테이블 형식으로 저장되고 사용자에게 표시되며 숫자 값, 텍스트 데이터, 수식, 외부 데이터 연결, 이미지 및 차트에 걸쳐 있을 수 있습니다. Microsoft Excel과 같은 응용 프로그램을 사용하면 통합 문서 데이터를 PDF, CSV, XLSX, TXT, HTML, XPS 및 기타 여러 형식을 포함한 다양한 형식으로 내보낼 수 있습니다. XLS 파일 형식은 Microsoft Excel 2007 릴리스와 함께 보다 개방적이고 구조화된 형식인 XLSX로 대체되었습니다. 최신 버전은 여전히 ​​XLS 파일 생성 및 읽기에 대한 지원을 제공하지만 XLSX가 현재 가장 먼저 사용되는 선택입니다.

    더 읽어보기

    TXT (텍스트 문서 파일)
    Text (텍스트 문서 파일)
    DOC (Microsoft Word에서 생성한 문서)
    DOCX (마이크로소프트 워드 문서)
    XLS (Microsoft Excel 이진 파일 형식)
    XLSX (마이크로소프트 엑셀 문서)
    PDF (휴대용 문서 형식(PDF))
    Searchable PDF (검색 가능한 휴대용 네트워크 그래픽)
    XML (확장 가능한 마크업 언어)
    JSON (자바스크립트 객체 표기법)