Python OCR 라이브러리
Python OCR을 사용하여 이미지를 텍스트로 변환
더 많은 쇼케이스 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
왜 .NET을 통해 Python용 Aspose.OCR을 사용하나요?
다양하고 사용자 친화적인 OCR API인 .NET을 통해 Python용 Aspose OCR을 사용해 보세요. 5줄 미만의 코드로 Python 애플리케이션에 OCR 기능을 포함시켜 복잡한 수학 또는 신경망이 필요하지 않게 합니다. 우리의 강력한 OCR 엔진은 비교할 수 없는 속도와 정확성을 제공하며 영어, 키릴어, 아랍어, 페르시아어, 힌디어, 중국어, 일본어, 한국어, 타밀어 등을 포함한 130개 이상의 언어를 지원합니다. 스캔한 이미지, 스마트폰 사진, 스크린샷, 스캔한 PDF 등 널리 사용되는 문서 및 데이터 교환 형식으로 결과를 얻으세요. 전처리 필터를 활용하여 회전되고, 기울어지고, 노이즈가 있는 이미지를 처리합니다.
효율적이고 정확한 OCR
고급 Python 기술을 통해 비교할 수 없는 속도와 정밀도의 OCR 결과를 경험해 보세요.
다국어
영어, 프랑스어, 독일어, 스페인어, 러시아어, 중국어, 힌디어, 일본어, 한국어, 타밀어, 아랍어, 페르시아어 등 140개 이상의 언어로 된 텍스트를 인식합니다.
만능인
Python을 사용하여 스캐너, 카메라, 스마트폰 등 다양한 소스의 이미지를 손쉽게 처리합니다.
아시아 언어
중국어, 아랍어, 데바나가리 문자, 드라비다 문자는 물론 혼합 언어 텍스트를 정확하게 인식합니다.
레이아웃 유지
정확한 텍스트 표현을 위해 소스 형식을 유지하고 테이블을 인식합니다.
라이브 코드 샘플
단 세 줄의 Python 코드로 이미지를 텍스트로 변환하세요. 직접 시도해 보세요!
* 파일을 업로드하거나 서비스를 이용함으로써 귀하는 당사의 약관에 동의하게 됩니다. 이용약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환
더 많은 사례 살펴보기 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
선호하는 것을 선택하세요
귀하의 요구에 맞는 라이브러리를 선택하십시오. 사용 가능한 API와 해당 기능을 살펴보고 가장 효율적인 솔루션을 선택하세요.
다재
Python via .NET
일률
Python via Java
성능
Python via C++
어디서나 실행
이름에 관계없이 .NET을 통한 Python용 Aspose.OCR은 대상 플랫폼에 .NET을 설치할 필요가 없습니다. 설치 패키지에는 필요한 모든 구성 요소가 이미 포함되어 있으며 로컬 시스템, 웹 서버, 클라우드 등 모든 플랫폼에서 원활하게 작동할 수 있습니다.
지원되는 파일 형식
Aspose.OCR for Python via .NET 모든 [파일]로 작업할 수 있습니다.( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) 스캐너나 카메라에서 얻을 수 있습니다. 인식 결과를 저장하거나 데이터베이스로 가져오거나 실시간으로 분석할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- BMP
- GIF
일괄 OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
인식결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
설치
.NET을 통한 Python용 Aspose.OCR은 최소한의 종속성을 갖춘 Python 패키지 또는 다운로드 가능한 파일 또는 [PyPI 패키지](https: //pypi.org/project/aspose-ocr-python-net/). 프로젝트에 쉽게 설치 하면 140개 이상의 언어로 된 텍스트를 인식하고 인식 결과를 다양한 형식으로 저장할 수 있습니다.
제한 없이 모든 기능을 갖춘 OCR 애플리케이션 개발을 시작하려면 평가판 라이선스를 요청 하세요.
Python에서의 OCR
우리 라이브러리는 쉽게 통합되어 Python 애플리케이션이 데스크톱 Windows, Windows Server, macOS, Linux 및 클라우드 등 모든 플랫폼에서 원활하게 실행될 수 있도록 합니다.
140개 이상의 인식 언어
당사의 Java OCR 라이브러리는 글로벌 규모의 문서 처리, 데이터 추출 및 콘텐츠 디지털화를 위한 범용 솔루션입니다. 광범위한 유럽, 중동 및 아시아 작문 스크립트를 지원하므로 모든 국가 및 비즈니스에 잘 적용됩니다.
Aspose OCR for Java는 중국어/영어, 아랍어/프랑스어, 키릴어/영어 등 다국어 문서의 텍스트를 인식합니다. 다음 언어가 지원됩니다:
- 확장 라틴어: 영어, 스페인어, 프랑스어, 인도네시아어, 포르투갈어, 독일어, 베트남어, 터키어, 이탈리아어, 폴란드어 외 80개 이상;
- 키릴 문자 알파벳: 러시아어, 우크라이나어, 카자흐어, 불가리아어(키릴/영어 혼합 텍스트 포함)
- 아랍어, 페르시아어, 우르두어(영어와 혼합된 텍스트 포함)
- 중국어, 한국어, 일본어, 데바나가리어, 드라비다어(힌디어, 타밀어, 마라티어 등) 혼합 언어 텍스트도 지원됩니다.
강력한 처리 필터
광학 문자 인식의 정확성과 신뢰성은 원본 이미지의 품질에 크게 좌우됩니다. .NET을 통해 Python용 Aspose OCR은 이미지가 OCR 엔진으로 전송되기 전에 이미지를 향상시키는 완전 자동화 및 수동 이미지 처리 필터를 많이 제공합니다.
- 거꾸로 된 이미지와 회전된 이미지를 자동으로 회전합니다.
- 반전된 이미지를 감지하고 검정색 바탕에 흰색 텍스트를 추출합니다.
- 먼지, 얼룩, 긁힘, 눈부심, 원치 않는 그라데이션 및 기타 소음을 자동으로 제거합니다.
- 이미지 대비를 자동으로 조정합니다.
- 자동으로 확대하거나 이미지 크기를 수동으로 조정합니다.
- 이미지를 흑백 또는 회색조로 변환합니다.
- 이미지에서 잠재적으로 문제가 있는 영역을 찾아 결함 유형 및 좌표에 대한 정보를 반환합니다.
- 이미지의 문자 두께를 늘립니다.
- 글자의 가장자리를 유지하면서 노이즈가 있는 이미지를 흐리게 만듭니다.
- 페이지 곡률을 직선화하고 페이지 사진의 카메라 렌즈 왜곡을 수정합니다.
특정 문서 유형에 최적화됨
.NET을 통한 Aspose OCR for Python은 특정 유형의 이미지에서 최대 정확도로 텍스트를 추출하기 위해 특별히 훈련된 신경망을 제공합니다.
내장 맞춤법 검사기
Python OCR 라이브러리는 높은 인식 정확도를 제공하지만 인쇄 결함, 먼지 또는 비표준 글꼴로 인해 특정 문자나 단어가 잘못 인식될 수 있습니다. 인식 결과를 더욱 향상시키려면 선택한 인식 언어를 기반으로 맞춤법 오류를 찾아 자동으로 수정하는 맞춤법 검사기를 켤 수 있습니다.
인식된 텍스트에 특수 용어, 약어 및 일반적인 철자 사전에 없는 기타 단어가 포함되어 있는 경우 고유한 단어 목록을 제공할 수 있습니다.
일괄 인식
Python OCR API를 사용하면 이미지를 하나씩 인식할 필요가 없습니다. 다양한 일괄 처리 방법을 사용하여 한 번의 호출로 여러 이미지를 인식합니다.
- 여러 페이지로 구성된 PDF, TIFF 및 DjVu 파일 인식.
- 폴더의 모든 파일을 인식합니다.
- 아카이브의 모든 파일을 인식합니다.
- 목록의 모든 파일을 인식합니다.
샘플을 통한 학습
Python용 OCR은 Python으로 작성된 일련의 예제 를 제공하므로 기능과 성능을 빠르게 익힐 수 있습니다. Python 비즈니스 요구 사항을 충족하는 맞춤형 솔루션을 만들기 위한 통찰력을 얻으세요.
특징 및 성능
Aspose.OCR for Python via .NET 귀하의 작업을 빠르고 쉽게 해결해 드립니다.
사진 OCR
스캔 수준의 정확도로 스마트폰 사진에서 텍스트를 추출합니다.
검색 가능한 PDF
모든 스캔을 검색, 색인 생성, 편집 가능한 문서로 변환하세요.
URL 인식
로컬로 다운로드하지 않고도 URL에서 이미지를 인식합니다.
대량 인식
여러 페이지로 구성된 문서, 폴더 및 아카이브에서 모든 이미지를 읽습니다.
모든 글꼴 및 스타일
널리 사용되는 모든 서체와 스타일의 텍스트를 식별하고 인식합니다.
인식 미세 조정
최상의 인식 결과를 얻으려면 모든 OCR 매개변수를 조정하세요.
맞춤법 검사기
철자가 틀린 단어를 자동으로 수정하여 결과를 개선합니다.
이미지에서 텍스트 찾기
이미지 세트 내에서 텍스트 또는 정규식을 검색합니다.
이미지 텍스트 비교
대소문자 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교합니다.
Python 코드 샘플
코드 샘플을 살펴보고 OCR을 Python 애플리케이션에 원활하게 통합하세요.
설치
Python Wheel 또는 독립적인 다운로드 가능 패키지로 배포되는 Aspose.OCR for Python은 .NET을 통해 쉽게 배포됩니다. 선호하는 Python 통합 개발 환경(IDE)에서 직접 Python 프로젝트에 통합하는 것은 원활한 프로세스입니다. 간단히 설치하면 전체 OCR 기능을 활용하여 인식 결과를 다양한 형식으로 저장할 수 있습니다.
설치 후 .NET을 통해 Python용 Aspose.OCR 사용을 즉시 시작할 수 있습니다. , 특정 제한이 있지만. 임시 라이센스는 30일 동안 모든 평가판 제한을 해제합니다. 이 기간을 활용하여 완전한 기능을 갖춘 OCR 애플리케이션 개발을 시작하면 나중에 .NET을 통해 Python용 Aspose.OCR 구매에 대한 정보를 바탕으로 결정을 내릴 수 있습니다.
라이센스 로드
lic = License()
lic.set_license(self.licPath)
사진에서 텍스트 인식
Python용 Aspose OCR의 모든 콘텐츠에서 텍스트를 읽는 것은 범용 인식 방법을 호출하는 것만큼 쉽습니다.
사진을 텍스트로 변환 - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python 범용 변환기
우리의 API는 스캐너, 카메라, 스마트폰에서 PDF 문서, JPEG, PNG, TIFF, GIF, BMP 이미지, 심지어 DjVu 파일까지 모든 이미지를 능숙하게 읽습니다. 다중 페이지 PDF 문서, TIFF 및 DjVu 이미지에 대한 완벽한 지원은 다양성을 보장합니다. URL을 통해 웹에서 이미지를 제공할 수도 있습니다.
인식 결과는 일반 텍스트, PDF, Microsoft Word, Microsoft Excel, JSON, XML 등 널리 사용되는 문서 및 데이터 교환 형식으로 반환됩니다.
PDF를 인식하고 결과를 다양한 출력 형식으로 저장 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Python의 리소스 최적화
광학 문자 인식에는 리소스가 필요합니다. 우리의 API는 전통적인 시간-가격-품질 3요소의 균형을 맞추는 유연한 방법을 제공합니다.
- 철저한 인식과 빠른 인식 중에서 선택하세요.
- 인식을 위해 할당된 스레드 수를 지정하거나 라이브러리가 프로세서 코어 수에 맞게 자동으로 확장되도록 허용합니다.
- 계산을 .NET 백엔드로 오프로드하여 CPU를 확보하세요.
빠른 인식 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
한 줄 인식
이미지가 이미 한 줄의 텍스트로 잘린 경우 자동 수정, 콘텐츠 구조 감지 및 기타 리소스 소모 단계 없이 가능한 가장 빠른 모드에서 인식할 수 있습니다. 일반 인식 프로세스보다 최대 7배 빠르게 OCR 속도를 높일 수 있습니다.
이미지에서 한 줄의 텍스트 인식 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)