Java를 통해 Python OCR API를 사용하여 이미지를 텍스트로 변환
Python을 사용하여 이미지 속 텍스트 인식
더 많은 쇼케이스 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Java를 통해 Python용 Aspose.OCR을 사용하는 이유는 무엇입니까?
Java를 통한 Python용 Aspose.OCR은 강력한 광학 문자 인식(OCR) 기능을 크로스 플랫폼 Python 노트북 및 애플리케이션에 원활하게 통합합니다. 직관적인 고속 API를 사용하면 스캔, 스크린샷, 웹 링크 또는 스마트폰 사진에서 텍스트를 손쉽게 추출하여 통합, 분석 또는 저장 가능한 결과를 제공할 수 있습니다. 스캔한 이미지, 스마트폰 사진, 스크린샷, 스캔한 PDF를 인식하고 결과를 널리 사용되는 문서 형식으로 저장합니다. 고급 전처리 필터는 회전, 기울어짐, 노이즈가 있는 이미지를 처리합니다. 작업을 GPU로 오프로드하여 성능을 최적화합니다.
신속하고 정확한 OCR
Java 기술을 통해 고급 Python을 사용하여 빠르고 정확한 OCR 결과를 얻을 수 있습니다.
다국어 지원
라틴어, 키릴 문자, 아랍어, 페르시아어, 인도어, 중국어 스크립트를 포함한 130개 이상의 언어로 된 텍스트를 인식하여 Java를 통해 Python 애플리케이션의 다양성을 보장합니다.
유연한 이미지 지원
Java를 통해 Python을 사용하여 스캐너, 카메라, 스마트폰의 이미지를 원활하게 처리합니다.
한자 인식의 정확성
Java를 통해 Python 프로젝트에서 6,000개 이상의 중국어 문자를 정확하게 인식합니다.
글꼴 스타일 및 서식 유지
Java를 통해 Python 애플리케이션에서 인식된 텍스트를 정확하게 표현하기 위해 글꼴 스타일과 형식을 유지합니다.
라이브 코드 샘플
단 세 줄의 코드로 이미지에서 텍스트 인식을 시작하세요. 간편함을 경험해보세요!
* 파일을 업로드하거나 서비스를 이용함으로써 귀하는 당사의 약관에 동의하게 됩니다. 이용약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환
더 많은 예 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
선호하는 것을 선택하세요
귀하의 요구에 맞는 라이브러리를 선택하십시오. 사용 가능한 API와 해당 기능을 살펴보고 가장 효율적인 솔루션을 선택하세요.
다재
Python via .NET
일률
Python via Java
성능
Python via C++
Java 백엔드 호환성
Python 모듈로 설계된 우리 라이브러리는 Microsoft Windows, Linux 및 macOS를 포함하여 Java 를 지원하는 주요 운영 체제 전반에서 호환성을 보장합니다. 클라우드 플랫폼. 이를 통해 한 플랫폼에서 애플리케이션을 개발하고 다른 플랫폼에서 원활하게 실행할 수 있으므로 코드를 수정할 필요가 없습니다.
지원되는 파일 형식
Aspose.OCR for Python via Java 모든 [파일]로 작업할 수 있습니다.( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) 스캐너나 카메라에서 얻을 수 있습니다. 인식 결과를 저장하거나 데이터베이스로 가져오거나 실시간으로 분석할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
일괄 OCR
- Multi-page PDF
- ZIP
- Folder
인식결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Java를 통한 손쉬운 Python 설치
Java를 통한 Python용 Aspose.OCR은 Python 패키지 또는 최소한의 종속성을 갖춘 다운로드 가능한 파일 로 제공됩니다. 프로젝트에 쉽게 설치 하면 지원되는 여러 언어의 텍스트를 인식하고 인식 결과를 다양한 형식으로 저장할 수 있습니다.
제한 없이 모든 기능을 갖춘 OCR 애플리케이션 개발을 시작하려면 평가판 라이선스를 요청 하세요.
Python 애플리케이션을 위한 강력한 OCR
우리 라이브러리는 쉽게 통합되어 Python 애플리케이션이 데스크톱 Windows, Windows Server, macOS, Linux 및 클라우드 등 모든 플랫폼에서 원활하게 실행될 수 있도록 합니다.
130개 이상의 인식 언어
Python 및 Java OCR API는 혼합 언어를 포함하여 다양한 언어와 널리 사용되는 작성 스크립트를 인식합니다.
향상된 인식 성능과 안정성을 위해 언어 감지를 라이브러리에 맡기거나 언어를 직접 정의하세요.
- 확장 라틴 알파벳: 영어, 스페인어, 프랑스어, 인도네시아어, 포르투갈어, 독일어, 베트남어, 터키어, 이탈리아어, 폴란드어 외 80개 이상;
- 키릴 문자 알파벳: 러시아어, 우크라이나어, 카자흐어, 세르비아어, 벨로루시어, 불가리아어;
- 아랍어, 페르시아어, 우르두어;
- 힌디어, 마라티어, Bhojpuri 등을 포함한 중국어 및 데바나가리 문자입니다.
향상된 이미지 처리 필터
광학 문자 인식의 정밀도는 원본 이미지의 품질에 크게 좌우됩니다. Java를 통한 Python용 Aspose.OCR은 OCR 엔진에 제출하기 전에 이미지를 최적화하기 위한 다양한 자동 및 수동 이미지 처리 필터를 제공합니다.
- 약간 기울어진 이미지를 자동으로 똑바르게 합니다.
- 심하게 기울어진 이미지의 회전을 수동으로 수정합니다.
- 먼지, 얼룩, 긁힘, 눈부심, 원치 않는 그라데이션 및 기타 유형의 소음을 자동으로 제거합니다.
- 이미지 대비를 자동으로 조정합니다.
- 이미지를 자동으로 확대하거나 수동으로 크기를 조정합니다.
- 이미지를 흑백 또는 회색조로 변환합니다.
- 이미지 색상을 반전시켜 밝은 부분을 어둡게, 어두운 부분을 밝게 만듭니다.
- 이미지의 문자 두께를 늘립니다.
- 글자 가장자리를 유지하면서 노이즈가 있는 이미지를 흐리게 처리합니다.
- 페이지 기울어짐을 교정하고 페이지 사진의 카메라 렌즈 왜곡을 수정합니다.
다양한 문서 유형에 특화된 API
Java를 통한 Python용 Aspose.OCR은 특정 유형의 이미지에서 최대 정확도로 텍스트를 추출하기 위해 특별히 훈련된 신경망을 제공합니다.
- 신분증과 여권을 스캔하거나 사진을 찍었습니다.
- 차량 번호판.
- 송장.
- 영수증.
내장 맞춤법 검사기
Java를 통한 Python용 Aspose.OCR은 높은 인식 정확도를 제공하지만 인쇄 결함, 먼지 또는 비표준 글꼴로 인해 특정 문자나 단어가 잘못 인식될 수 있습니다. 인식 결과를 더욱 향상시키려면 선택한 인식 언어를 기반으로 맞춤법 오류를 찾아 자동으로 수정하는 맞춤법 검사기를 켤 수 있습니다.
인식된 텍스트에 특수 용어, 약어 및 일반적인 철자 사전에 없는 기타 단어가 포함되어 있는 경우 고유한 단어 목록을 제공할 수 있습니다.
효율적인 배치 인식
Python OCR API를 사용하면 이미지 인식을 간소화할 수 있습니다. 단일 호출로 여러 이미지를 효율적으로 처리하기 위해 다양한 일괄 처리 방법을 활용합니다.
- 여러 페이지로 구성된 PDF, TIFF 파일을 인식합니다.
- 폴더 내의 모든 파일을 처리합니다.
- 아카이브의 모든 파일에 대한 인식을 처리합니다.
- 지정된 목록에서 이미지를 인식합니다.
Python 예제를 통한 학습
OCR 솔루션의 기능과 성능을 신속하게 파악하는 데 도움이 되도록 설계된 다양한 Python 예제 를 살펴보세요. 특정 비즈니스 요구 사항을 충족하는 맞춤형 솔루션을 만드는 방법에 대한 통찰력을 빠르게 얻으세요.
특징 및 기능
Aspose.OCR for Python via Java Python용 Aspose.OCR의 고급 기능 살펴보기
사진 OCR
스캔 수준의 정확도로 스마트폰 사진에서 텍스트를 추출합니다.
검색 가능한 PDF
모든 스캔을 검색 및 색인 생성이 가능한 문서로 변환하세요.
URL 인식
로컬로 다운로드하지 않고도 URL에서 이미지를 인식합니다.
대량 인식
여러 페이지로 구성된 문서, 폴더 및 아카이브에서 모든 이미지를 읽습니다.
모든 글꼴 및 스타일
널리 사용되는 모든 서체와 스타일의 텍스트를 식별하고 인식합니다.
인식 미세 조정
최상의 인식 결과를 얻으려면 모든 OCR 매개변수를 조정하세요.
맞춤법 검사기
철자가 틀린 단어를 자동으로 수정하여 결과를 개선합니다.
이미지에서 텍스트 찾기
이미지 세트 내에서 텍스트 또는 정규식을 검색합니다.
이미지 텍스트 비교
대소문자 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교합니다.
Python 코드 샘플
Java를 통해 Python용 Aspose.OCR을 애플리케이션에 원활하게 통합하는 코드 샘플을 찾아보세요.
손쉬운 설치
Python 패키지 또는 최소한의 종속성을 갖춘 다운로드 가능한 파일로서 Java를 통한 Python용 Aspose.OCR은 손쉬운 배포를 보장합니다. Python에서 직접 프로젝트에 통합하면 완전한 OCR 기능을 활용하여 인식 결과를 다양한 형식으로 저장할 수 있습니다.
설치 후 Java를 통해 Python용 Aspose.OCR을 즉시 사용하기 시작하세요. 특정 제한이 있지만. 임시 라이센스는 30일 동안 모든 평가판 제한을 제거합니다. 이 기간을 활용하여 완전한 기능을 갖춘 OCR 애플리케이션 개발을 시작하면 나중에 Java를 통해 Python용 Aspose.OCR을 구매할 때 정보에 입각한 결정을 내릴 수 있습니다.
라이센스 로드
lic = License()
lic.set_license(self.licPath)
이미지 인식
OCR 애플리케이션의 주요 과제는 최종 사용자를 위한 스캐너가 부족하다는 것입니다. Java를 통해 Python과 완벽하게 통합된 당사의 API에는 회전, 기울어짐, 노이즈가 있는 이미지를 처리하는 강력한 내장 이미지 전처리 필터가 있습니다. 모든 이미지 형식을 지원하므로 스마트폰 사진에서도 안정적인 인식이 가능합니다. 대부분의 전처리 및 이미지 수정은 자동화되어 있어 어려운 경우에만 개입이 필요합니다.
자동 이미지 수정 적용 - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python 범용 변환기
우리의 API는 스캐너, 카메라, 스마트폰에서 PDF 문서, JPEG, PNG, TIFF, GIF, BMP 파일 등 모든 이미지를 능숙하게 읽습니다. 다중 페이지 PDF 문서, TIFF 및 DjVu 이미지에 대한 완벽한 지원은 다양성을 보장합니다. URL을 통해 웹에서 이미지를 제공할 수도 있습니다.
인식 결과는 일반 텍스트, PDF, Microsoft Word, Microsoft Excel, JSON, XML 등 널리 사용되는 문서 및 데이터 교환 형식으로 반환됩니다.
PDF를 인식하고 결과를 다양한 출력 형식으로 저장 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
리소스 사용량 최적화
OCR은 텍스트가 적고 배경이 시끄럽거나 색상이 있는 이미지에서 콘텐츠를 추출하기 위한 특수 인식 알고리즘을 제공합니다. 이 방법은 다음 비즈니스 사례에서 OCR 정확도를 크게 향상시킵니다.
- 거리 사진에서 텍스트를 읽어보세요.
- 거리 이미지 내에서 도로 표지판과 간판을 분할하고 식별합니다.
- 가격표를 찾고 추출된 텍스트를 가격으로 해석합니다.
- 영양 정보나 성분 목록 등 식품 라벨에서 관심 있는 지역을 찾고 집계합니다.
- 자동차 번호판을 식별하고 분석합니다.
- 메뉴와 카탈로그에서 텍스트를 추출합니다.
개방형 OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
거리 사진에서 텍스트 추출
Python용 OCR은 어둡고 흐린 사진을 포함하여 차량 번호판에서 텍스트를 추출하는 특수 인식 알고리즘을 제공합니다. 결과 텍스트는 자동으로 데이터베이스에 저장되거나 자동으로 검증될 수 있습니다.
자동차 번호 인식 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)