Java를 통해 Python OCR API를 사용하여 텍스트로 이미지 변환
파이썬으로 이미지에서 텍스트를 인식하십시오
더 많은 쇼케이스 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
왜 Java를 통해 Python에 대한 Aspose.ocr?
Java를 통한 Python 용 Aspose.oc는 강력한 광학 문자 인식 (OCR) 기능을 크로스 플랫폼 Python 노트북 및 응용 프로그램에 완벽하게 통합합니다. 직관적이고 고속 API를 사용하면 스캔, 스크린 샷, 웹 링크 또는 스마트 폰 사진에서 텍스트를 쉽게 추출하여 통합, 분석 또는 스토리지를위한 결과를 제공 할 수 있습니다. 스캔 된 이미지, 스마트 폰 사진, 스크린 샷 및 스캔 된 PDF를 인식하여 인기있는 문서 형식으로 결과를 저장합니다. 고급 사전 처리 필터는 회전, 왜곡 및 시끄러운 이미지를 처리합니다. 작업을 GPU에 오프로드하여 성능을 최적화하십시오.

신속하고 정확한 OCR
Java 기술을 통해 고급 파이썬으로 고속 및 정확한 OCR 결과를 달성하십시오.
다국어 지원
라틴어, 키릴, 아랍어, 페르시아어, 인디 및 중국 스크립트를 포함한 140 개 이상의 언어로 텍스트를 인식하여 Java를 통한 파이썬 응용 프로그램에 대한 다목적 성을 보장합니다.
유연한 이미지 지원
Java를 통해 파이썬으로 스캐너, 카메라 및 스마트 폰의 이미지를 완벽하게 처리합니다.
중국어 인식의 정밀도
Java를 통해 파이썬 프로젝트에서 정밀한 6,000 명 이상의 한자를 인식하십시오.
글꼴 스타일과 서식을 보존하십시오
Java를 통해 Python 응용 프로그램에서 인식 된 텍스트를 정확하게 표현하기 위해 글꼴 스타일 및 서식을 유지합니다.
라이브 코드 샘플
3 줄의 코드로 이미지에서 텍스트 인식을 시작하십시오. 단순성을 경험하십시오!
* 파일을 업로드하거나 서비스를 사용하여 귀하는 동의합니다. 이용 약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환합니다
더 많은 예 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
선호도를 선택하십시오
필요에 맞는 올바른 라이브러리를 선택하십시오. 사용 가능한 API 및 기능을 탐색하여 가장 효율적인 솔루션을 선택하십시오.
다재
Python via .NET
일률
Python via Java
성능
Python via C++
Java 백엔드 호환성
파이썬 모듈로 설계된이 라이브러리는 Microsoft Windows, Linux 및 MacOS 또는 Cloud 플랫폼을 포함하여 Java 를 지원하는 주요 운영 체제의 호환성을 보장합니다. 이를 통해 한 플랫폼에서 응용 프로그램을 개발하고 다른 플랫폼에서 원활하게 실행하여 코드 수정이 필요하지 않습니다.
지원되는 파일 형식
Aspose.OCR for Python via Java [파일]과 함께 작동 할 수 있습니다.( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) 스캐너 나 카메라에서 얻을 수 있습니다. 인식 결과를 저장, 데이터베이스로 가져 오거나 실시간으로 분석 할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
배치 OCR
- Multi-page PDF
- ZIP
- Folder
인식 결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Java를 통한 파이썬에 대한 손쉬운 설치
Java를 통한 Python의 Aspose.ocr은 Python 패키지 또는 최소한의 종속성을 가진 [https://releases.aspose.com/ocr/python-java/)로 전달됩니다. 쉽게 install 프로젝트에 참여하면 여러 지원 언어로 텍스트를 인식하고 다양한 형식으로 인식 결과를 저장할 준비가되었습니다.
시험 라이센스 요청 제한없이 완전히 기능적인 OCR 애플리케이션의 개발을 시작합니다.
파이썬 애플리케이션을위한 강력한 OCR
당사의 라이브러리는 쉽게 통합되어 Python Application이 데스크탑 Windows, Windows Server, MacOS, Linux 및 클라우드 등 모든 플랫폼에서 완벽하게 실행할 수 있습니다.
140+ 인식 언어
우리의 파이썬과 Java OCR API는 혼합 언어를 포함하여 수많은 언어와 인기있는 작문 스크립트를 인정합니다.
인식 성능과 신뢰성을 높이기 위해 언어 탐지를 라이브러리에 맡기거나 언어를 직접 정의하십시오.
- ** 확장 된 라틴어 ** 알파벳 : 영어, 스페인어, 프랑스어, 인도네시아어, 포르투갈어, 독일어, 베트남어, 터키, 이탈리아어, 폴란드어 및 80+ 더;
- ** 키릴 릭 ** 알파벳 : 러시아어, 우크라이나, 카자흐, 세르비아, 벨로루시, 불가리아어;
- 아랍어, 페르시아어, 우르두어;
- 힌디어, 마라 티, 부 푸리 등을 포함한 중국어와 데바나 가리 스크립트.
향상된 이미지 처리 필터
광학 문자 인식의 정밀도는 원본 이미지의 품질에 크게 의존합니다. Java를 통해 Python 용 Aspose.ocr OCR 엔진에 제출하기 전에 이미지를 최적화하기 위해 자동화 된 및 수동 이미지 처리 필터를 모두 제공합니다.
- 약간 기울어 진 이미지를 자동으로 똑 바르게합니다.
- 심하게 왜곡 된 이미지의 회전을 수동으로 수정하십시오.
- 먼지, 반점, 긁힘, 눈부심, 원치 않는 그라디언트 및 기타 유형의 노이즈를 자동으로 제거합니다.
- 이미지 대비를 자동으로 조정하십시오.
- 자동으로 고급 또는 수동으로 이미지를 조정합니다.
- 이미지를 흑백 또는 그레이 스케일로 변환하십시오.
- 이미지 색상을 반전시키고 가벼운 영역이 어둡고 어두운 영역이 나타나는 것처럼 보입니다.
- 이미지에서 문자의 두께를 늘리십시오.
- 글자 가장자리를 보존하면서 시끄러운 이미지를 흐리게합니다.
- 페이지를 똑바로 세우고 페이지 사진에서 카메라 렌즈 왜곡을 올바르게합니다.
다양한 문서 유형에 대한 Specilized API
Java를 통해 Python 용 Python 용 Asce는 특별히 훈련 된 신경망을 제공하여 최대의 정확도로 특정 유형의 이미지에서 텍스트를 추출합니다.
- 스캔 또는 촬영 된 ID 카드 및 여권.
- 차량 번호판.
- 송장.
- 영수증.
내장 된 맞춤법 검사기
Java를 통해 Python의 Aspose.ocr은 높은 인식 정확도를 제공하지만 인쇄 결함, 먼지 또는 비표준 글꼴로 인해 특정 문자 나 단어가 잘못 인식 될 수 있습니다. 인식 결과를 더욱 향상 시키려면 선택한 인식 언어를 기반으로 맞춤법 오류를 찾아 자동으로 수정하는 맞춤법 검사기를 켜면 철자 오류가 자동으로 수정 될 수 있습니다.
인정 된 텍스트에 특수 용어, 약어 및 일반적인 철자 사전에 존재하지 않는 다른 단어가 포함 된 경우 자신의 단어 목록을 제공 할 수 있습니다.
효율적인 배치 인식
Python OCR API를 사용하면 이미지 인식을 간소화 할 수 있습니다. 한 번의 호출에서 여러 이미지의 효율적인 처리를 위해 다재다능한 배치 프로세싱 방법을 활용하십시오.
- 다중 페이지 PDF, TIFF 파일을 인식하십시오.
- 폴더 내의 모든 파일을 처리합니다.
- 아카이브의 모든 파일에 대한 인식을 처리합니다.
- 지정된 목록에서 이미지를 인식하십시오.
파이썬 예제를 통해 학습
OCR 솔루션의 기능과 기능을 신속하게 파악할 수 있도록 설계된 다양한 [Python examples.aspose.com/ocr/python-java/conversion/)를 탐색하십시오. 특정 비즈니스 요구 사항을 충족하는 맞춤형 솔루션을 만드는 데 신속하게 통찰력을 얻으십시오.
특징 및 기능
Aspose.OCR for Python via Java Python의 Aspose.ocr의 고급 기능을 탐색하십시오
사진 OCR
스캔 레벨 정확도로 스마트 폰 사진에서 텍스트를 추출하십시오.
검색 가능한 PDF
모든 스캔을 완전히 검색 가능하고 색인 가능한 문서로 변환하십시오.
URL 인식
로컬로 다운로드하지 않고 URL에서 이미지를 인식하십시오.
대량 인식
다중 페이지 문서, 폴더 및 아카이브의 모든 이미지를 읽으십시오.
모든 글꼴과 스타일
모든 인기있는 서체와 스타일에서 텍스트를 식별하고 인식하십시오.
미세 조정 인식
최상의 인식 결과를 위해 모든 OCR 매개 변수를 조정하십시오.
맞춤법 검사기
잘못된 철자를 자동으로 수정하여 결과를 향상시킵니다.
이미지에서 텍스트를 찾으십시오
이미지 세트 내에서 텍스트 또는 정규 표현식을 검색하십시오.
이미지 텍스트를 비교하십시오
케이스 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교하십시오.
파이썬 코드 샘플
Java를 통해 응용 프로그램에 Python의 Aspose.oc를 완벽하게 통합 할 코드 샘플을 발견하십시오.
손쉬운 설치
Python 패키지 또는 최소한의 종속성을 가진 다운로드 가능한 파일로서 Java를 통해 Python의 경우에. Python에서 직접 프로젝트에 통합하면 완전한 OCR 기능을 활용하여 다양한 형식으로 인식 결과를 저장할 준비가되어 있습니다.
설치 후, 특정 제한 사항이 있음에도 불구하고 Java를 통해 Python에 aspose.ocr을 즉시 시작하십시오. 임시 라이센스는 30 일 동안 모든 시험판 제한을 제거합니다. 이 기간을 활용하여 완전히 기능적인 OCR 응용 프로그램의 개발을 시작하여 나중에 Java를 통해 Python의 구매에 대한 정보에 근거한 결정을 내릴 수 있습니다.
로드 라이센스
lic = License()
lic.set_license(self.licPath)
이미지 인식
OCR 애플리케이션의 주요 과제는 최종 사용자를위한 스캐너가 부족하다는 것입니다. Java를 통해 Python과 원활하게 통합 된 API는 강력한 내장 이미지 사전 처리 필터 처리 회전, 왜곡 및 시끄러운 이미지를 특징으로합니다. 모든 이미지 형식에 대한 지원과 결합하여 스마트 폰 사진에서도 신뢰할 수있는 인식이 가능합니다. 대부분의 사전 처리 및 이미지 보정은 자동화되므로 도전적인 경우에만 개입해야합니다.
자동 이미지 수정 -Python을 적용하십시오
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
파이썬 범용 변환기
API는 스캐너, 카메라 또는 스마트 폰 (PDF 문서, JPEG, PNG, TIFF, GIF, BMP 파일의 이미지를 적절하게 읽습니다. 다중 페이지 PDF 문서, TIFF 및 DJVU 이미지에 대한 완전한 지원은 다양성을 보장합니다. URL을 통해 웹에서 이미지를 제공 할 수도 있습니다.
인식 결과는 대중 문서 및 데이터 교환 형식으로 반환됩니다 : 일반 텍스트, PDF, Microsoft Word, Microsoft Excel, JSON 및 XML.
PDF 인식 및 다양한 출력 형식으로 결과를 저장 -Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
리소스 사용 최적화
OCR은 희소 텍스트와 시끄러운/색상 배경으로 이미지에서 컨텐츠를 추출하기위한 특별 인식 알고리즘을 제공합니다. 이 방법은 다음 비즈니스 사례에서 OCR 정확도를 크게 향상시킵니다.
- 거리 사진에서 텍스트를 읽으십시오.
- 거리 이미지 내에서 도로 표지판 및 간판을 분류하고 식별하십시오.
- 가격표를 찾아 추출한 텍스트를 가격으로 해석하십시오.
- 영양 정보 또는 성분 목록과 같은 식품 라벨에서 관심있는 영역을 찾고 집계합니다.
- 자동차 번호판을 식별하고 분석합니다.
- 메뉴 및 카탈로그에서 텍스트를 추출하십시오.
오픈 지역 OCR- 파이썬
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
거리 사진에서 텍스트 추출
Python 용 OCR은 어둡고 흐릿한 사진을 포함하여 차량 번호판에서 텍스트를 추출하는 특수 인식 알고리즘을 제공합니다. 그런 다음 결과 텍스트를 데이터베이스에 자동으로 저장하거나 자동으로 확인할 수 있습니다.
자동차 번호 인식 -Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)