Java OCR API를 사용하여 텍스트 이미지
자바의 텍스트로 이미지를 변환합니다
더 많은 쇼케이스 >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Java 용 OCR 라이브러리를 선택하는 이유는 무엇입니까?
OCR Java 라이브러리를 사용하여 강력한 OCR을 잠금 해제하십시오. 우리의 Java API는 효율적이고 사용자 친화적이며 비용 효율적인 OCR API입니다. Java 코드의 5 줄만에 신경망 및 기타 기술적 세부 사항을 이해하지 않고도 응용 프로그램에 강력한 OCR 기능을 추가하십시오.
OCR 엔진은 영어, 크릴리, 아랍어, 페르시아어, 중국어, 일본어, 힌디어, 타밀어 등 140 개 이상의 언어를 지원하는 비교할 수없는 속도와 정확도를 제공합니다. 스캔, 스마트 폰 사진, 스크린 샷 또는 PDF를 사용하든 OCR은 텍스트를 추출하고 모든 인기있는 형식으로 결과를 생성합니다.
이미지 전처리는 자동으로 회전, 흐릿한, 반전 및 시끄러운 이미지를 자동으로 수정하여 모든 조건에서 가장 높은 인식 정확도를 보장합니다.

신속하고 정확한 OCR
고급 Java 기술로 고속 및 정확한 OCR 결과를 달성하십시오.
다국어 지원
영어, 프랑스어, 키릴, 아랍어, 페르시아어, 인디, 중국어, 일본어, 한국, 타밀어 및 기타 스크립트를 포함하여 140 개 이상의 언어로 텍스트를 인식하십시오.
모든 이미지
스캐너, 카메라 및 스마트 폰과 같은 다양한 소스의 이미지를 처리하십시오.
혼합 언어 탐지
중국어/영어, 아랍어/프랑스어, 힌디어/영어 및 키릴/영어와 같은 혼합 언어로 작성된 문서를 인식하십시오.
모든 글꼴, 스타일 및 형식
글꼴 스타일에 관계없이 텍스트 레이아웃을 정확하게 보존하고 테이블 구조를 감지하며 텍스트를 원활하게 인식합니다.
라이브 코드 샘플
단순성 경험 : 자바 코드의 몇 줄로 이미지 변환 텍스트로 텍스트로 변환
* 파일을 업로드하거나 서비스를 사용하여 귀하는 동의합니다. 이용 약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환합니다
더 많은 예를 탐색하십시오 >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
크로스 플랫폼
Java OCR 코드는 Java SE 6.0 이상 를 지원하는 모든 플랫폼에서 원활하게 작동합니다.
지원되는 파일 형식
Aspose.OCR for Java [파일]과 함께 작동 할 수 있습니다.( https://docs.aspose.com/ocr/java/supported-file-formats/ ) 스캐너 나 카메라에서 얻을 수 있습니다. 인식 결과를 저장, 데이터베이스로 가져 오거나 실시간으로 분석 할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
배치 OCR
- Multi-page PDF
- ZIP
- Folder
인식 결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
쉬운 설치
Java의 Aspose.ocr은 경량 Java Archive (JAR) 파일 또는 다운로드 가능한 파일 로 배포됩니다. 간단히 install 프로젝트에 들어가면 여러 지원 언어로 텍스트를 인식하고 다양한 형식으로 인식 결과를 저장하도록 설정되어 있습니다.
시험 라이센스 요청 제한없이 완전히 기능적인 OCR 애플리케이션의 개발을 시작합니다.
어디에서나 작동합니다
당사의 Java Library는 Java SE 6 이상을 완전히 지원하므로 응용 프로그램이 데스크탑 Windows, Windows Server, MacOS, Linux 및 클라우드와 같은 모든 플랫폼에서 애플리케이션을 완벽하게 실행할 수 있습니다.
140+ 인식 언어
Java OCR 라이브러리는 글로벌 규모의 문서 처리, 데이터 추출 및 컨텐츠 디지털화를위한 보편적 인 솔루션입니다. 다양한 유럽, 중동 및 아시아 작문 대본을 지원함으로써 모든 국가와 비즈니스에 적합합니다.
Java의 OCR을 사용하면 중국어/영어, 아랍어/프랑스어 또는 키릴/영어와 같은 다국어 문서에서 텍스트를 인식합니다. 다음 언어가 지원됩니다.
- ** 확장 된 라틴어 ** : 영어, 스페인어, 프랑스어, 인도네시아, 포르투갈어, 독일어, 베트남어, 터키, 이탈리아어, 폴란드어 및 80+ 더;
- ** 키릴 릭 ** 알파벳 : 러시아어, 우크라이나, 카자흐, 불가리아어, 혼합 키릴/영어 텍스트를 포함한 불가리아;
- 영어와 혼합 된 텍스트를 포함한 아랍어, 페르시아어, 우르두어;
- 힌디어, 타밀어, 마라 티어 등을 포함한 중국어, 한국, 일본, 데바나 가리 및 드라비아 언어.
특징 및 기능
Aspose.OCR for Java Java의 Aspose OCR의 고급 기능과 기능을 탐색하십시오.
사진 OCR
스캔 레벨 정확도로 스마트 폰 사진에서 텍스트를 추출하십시오.
검색 가능한 PDF
검색 가능하고 편집 가능한 문서로 스캔을 변환하십시오.
URL 인식
로컬로 다운로드하지 않고 URL에서 이미지를 인식하십시오.
대량 인식
다중 페이지 문서, 폴더 및 아카이브의 모든 이미지를 읽으십시오.
모든 글꼴과 스타일
모든 인기있는 서체와 스타일에서 텍스트를 식별하고 인식하십시오.
미세 조정 인식
최상의 인식 결과를 위해 모든 OCR 매개 변수를 조정하십시오.
맞춤법 검사기
잘못된 철자를 자동으로 수정하여 결과를 향상시킵니다.
이미지에서 텍스트를 찾으십시오
이미지 세트 내에서 텍스트 또는 정규 표현식을 검색하십시오.
이미지 텍스트를 비교하십시오
케이스 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교하십시오.
세계적인
자동 언어 탐지로 모든 언어의 텍스트를 추출하십시오.
주요 세부 사항 추출
ID 카드에서 중요한 세부 정보를 자동으로 추출합니다.
Aspose 솔루션과의 전체 통합
포괄적이고 효율적인 Java 솔루션을 위해 OCR을 다른 Aspose 제품과 완벽하게 통합하십시오.
코드 샘플
OCR API를 Java 응용 프로그램에 원활하게 통합하는 방법을 배우려면 코드 샘플을 탐색하십시오.
설치
자바의 스캔 된 이미지에서 텍스트를 인식하십시오
광범위한 스캐너가없는 OCR 애플리케이션의 도전을 극복하십시오. 우리의 API는 강력한 내장 이미지 사전 처리 필터를 자랑하며 회전, 왜곡 및 시끄러운 이미지를 적절하게 처리합니다. 모든 이미지 형식에 대한 지원과 결합하여 스마트 폰 사진에서도 안정적인 인식을 보장합니다. 대부분의 사전 처리 및 이미지 보정은 자동화되므로 도전적인 경우에만 개입해야합니다.
자동 이미지 수정 -Java를 적용하십시오
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Java의 사진에서 텍스트를 추출하십시오
Java 응용 프로그램에서 텍스트 감지 및 인식을 통합하십시오. 사진의 정확한 결과에 쉽게 액세스하여 이미지 처리 기능을 향상시킵니다. 이미지 처리 기능을 높이고 사진에서 정확한 결과를 얻습니다.
사진 -Java에서 텍스트를 감지하고 인식하십시오
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
자바의 리소스 최적화
광학 문자 인식은 자원을 요구합니다. 우리의 API는 고전적인 시간 가격 품질 트라이어드의 균형을 맞추는 유연한 방법을 제공합니다. 인식 엔진에서 사용하는 스레드 수를 제한 할 수 있습니다. 이 조정으로 인식 속도가 느리게 발생할 수 있지만 병렬 이미지 처리, 웹 서버 작업, 데이터베이스 관리 또는 배경 데이터 분석과 같은 동시 작업에 리소스를 할당 할 수 있습니다.
- 철저한 인식과 빠른 인식을 선택하십시오.
- 인식을 위해 할당 된 스레드 수를 지정하거나 라이브러리가 프로세서 코어 수로 자동 스케일링하도록 허용하십시오.
- GPU에 계산을 오프로드하여 CPU를 확보하십시오.
자원의 균형을 잡습니다
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
최소 설정으로 빠른 인식
이미지가 왜곡 또는 왜곡이없는 고품질 스캔 인 경우 다음을 사용하여 가능한 최소 리소스를 소비하는 가장 빠른 인식 모드를 사용할 수 있습니다.
빠른 인식 OCR -Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});