파이썬 OCR 도서관
Python OCR을 사용하여 이미지를 텍스트로 변환하십시오
더 많은 쇼케이스 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
.NET를 통해 Python의 이유는 무엇입니까?
.NET를 통해 Python 용 OCR과 함께 여행을 시작하십시오. 다목적이고 사용자 친화적 인 OCR API. 5 줄 미만의 코드로 OCR 기능을 Python 애플리케이션에 포함시켜 복잡한 수학 또는 신경망이 필요하지 않습니다. 우리의 강력한 OCR 엔진은 비교할 수없는 속도와 정확성을 제공하며 영어, 키릴, 아랍어, 페르시아어, 힌디어, 일본어, 한국, 타밀어 등을 포함한 140 개 이상의 언어를 지원합니다. 스캔 한 이미지, 스마트 폰 사진, 스크린 샷 또는 스캔 된 PDF에 관계없이 인기있는 문서 및 데이터 교환 형식에서 결과를 얻습니다. 사전 처리 필터를 활용하여 회전, 왜곡 및 시끄러운 이미지를 처리합니다.

효율적이고 정확한 OCR
고급 파이썬 기술로 OCR 결과에서 비교할 수없는 속도와 정밀도를 경험하십시오.
다국어
영어, 프랑스어, 독일어, 스페인어, 러시아어, 중국어, 힌디어, 일본어, 한국어, 타밀어, 아랍어, 페르시아어 등 140 개 이상의 언어로 텍스트를 인식하십시오.
만능인
파이썬을 사용하여 다양한 소스 (스캐너, 카메라 및 스마트 폰)의 이미지를 쉽게 처리합니다.
아시아 언어
중국, 아랍어, 데바나 가리 및 드라 비디 안 스크립트뿐만 아니라 혼합 텍스트에 대한 정확한 인정을 얻으십시오.
레이아웃을 보존하십시오
정확한 텍스트 표현을 위해 소스 형식을 유지하고 테이블을 인식하십시오.
라이브 코드 샘플
3 줄의 파이썬 코드로 이미지를 텍스트로 변환하십시오. 직접 시도하십시오!
* 파일을 업로드하거나 서비스를 사용하여 귀하는 동의합니다. 이용 약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환합니다
더 많은 예를 찾으십시오 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
선호도를 선택하십시오
필요에 맞는 올바른 라이브러리를 선택하십시오. 사용 가능한 API 및 기능을 탐색하여 가장 효율적인 솔루션을 선택하십시오.
다재
Python via .NET
일률
Python via Java
성능
Python via C++
어디서나 달린다
이름에 관계없이 .NET를 통해 Python for. 설치 패키지에는 이미 필요한 모든 구성 요소가 함께 제공되며 로컬 컴퓨터, 웹 서버 또는 클라우드 등 모든 플랫폼에서 원활하게 작동 할 수 있습니다.
지원되는 파일 형식
Aspose.OCR for Python via .NET [파일]과 함께 작동 할 수 있습니다.( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) 스캐너 나 카메라에서 얻을 수 있습니다. 인식 결과를 저장, 데이터베이스로 가져 오거나 실시간으로 분석 할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- BMP
- GIF
배치 OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
인식 결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
설치
.NET를 통해 Python의 경우. 쉽게 설치 프로젝트에 들어가면 140 개 이상의 언어로 텍스트를 인식하고 다양한 형식으로 인식 결과를 저장할 준비가되었습니다.
시험 라이센스 요청 제한없이 완전히 기능적인 OCR 애플리케이션의 개발을 시작합니다.
파이썬 아래의 OCR
당사의 라이브러리는 쉽게 통합되어 Python Application이 데스크탑 Windows, Windows Server, MacOS, Linux 및 클라우드 등 모든 플랫폼에서 완벽하게 실행할 수 있습니다.
140+ 인식 언어
Java OCR 라이브러리는 글로벌 규모의 문서 처리, 데이터 추출 및 컨텐츠 디지털화를위한 보편적 인 솔루션입니다. 다양한 유럽, 중동 및 아시아 작문 대본을 지원함으로써 모든 국가와 비즈니스에 적합합니다.
Java의 OCR을 사용하면 중국어/영어, 아랍어/프랑스어 또는 키릴/영어와 같은 다국어 문서에서 텍스트를 인식합니다. 다음 언어가 지원됩니다.
- ** 확장 된 라틴어 ** : 영어, 스페인어, 프랑스어, 인도네시아, 포르투갈어, 독일어, 베트남어, 터키, 이탈리아어, 폴란드어 및 80+ 더;
- ** 키릴 릭 ** 알파벳 : 러시아어, 우크라이나, 카자흐, 불가리아어, 혼합 키릴/영어 텍스트를 포함한 불가리아;
- 영어와 혼합 된 텍스트를 포함한 아랍어, 페르시아어, 우르두어;
- 힌디어, 타밀어, 마라 티어 등을 포함한 중국어, 한국, 일본, 데바나 가리 및 드라비아 언어. 혼합 언어 텍스트도 지원됩니다.
강력한 처리 필터
광학 문자 인식의 정확성과 신뢰성은 원본 이미지의 품질에 크게 의존합니다. .NET를 통해 Python 용 OCR을 사용하면 OCR 엔진으로 전송되기 전에 이미지를 향상시키는 완전 자동화 및 수동 이미지 처리 필터를 제공합니다.
- 거꾸로 및 회전 된 이미지를 자동으로 회전시킵니다.
- 거꾸로 된 이미지를 감지하고 흰색 텍스트를 추출하십시오.
- 먼지, 반점, 긁힘, 눈부심, 원치 않는 그라디언트 및 기타 소음을 자동으로 제거합니다.
- 이미지 대비를 자동으로 조정하십시오.
- 자동으로 고급 스케일 또는 이미지를 수동으로 조정합니다.
- 이미지를 흑백 또는 그레이 스케일로 변환하십시오.
- 이미지의 잠재적 인 문제가있는 영역을 찾고 결함 유형 및 좌표에 대한 정보를 반환하십시오.
- 이미지에서 문자의 두께를 늘리십시오.
- 글자의 가장자리를 보존하면서 시끄러운 이미지를 흐리게합니다.
- 페이지 곡선을 똑바로 세우고 페이지 사진의 카메라 렌즈 왜곡을 고정합니다.
특정 문서 유형에 최적화되었습니다
.NET를 통해 Python 용 OCR을 사용하여 특수 훈련 된 신경망을 제공하여 최대의 정확도로 특정 유형의 이미지에서 텍스트를 추출 할 수 있습니다.
내장 된 맞춤법 검사기
Python OCR 라이브러리는 높은 인식 정확도를 제공하지만 인쇄 결함, 먼지 또는 비표준 글꼴로 인해 특정 문자 나 단어가 잘못 인식 될 수 있습니다. 인식 결과를 더욱 향상 시키려면 선택한 인식 언어를 기반으로 맞춤법 오류를 찾아 자동으로 수정하는 맞춤법 검사기를 켜면 철자 오류가 자동으로 수정 될 수 있습니다.
인정 된 텍스트에 특수 용어, 약어 및 일반적인 철자 사전에 존재하지 않는 다른 단어가 포함 된 경우 자신의 단어 목록을 제공 할 수 있습니다.
배치 인식
우리의 Python OCR API는 이미지를 하나씩 인식하지 못하게합니다. 한 번의 호출에서 여러 이미지를 인식하기 위해 다양한 배치 프로세싱 방법을 사용하십시오.
- 다중 페이지 PDF, TIFF 및 DJVU 파일의 인식.
- 폴더의 모든 파일을 인식합니다.
- 아카이브의 모든 파일을 인식합니다.
- 목록에서 모든 파일을 인식합니다.
샘플에 의한 학습
Python 용 OCR은 Python으로 작성된 예제 배열을 제공하여 기능과 기능을 신속하게 알릴 수 있습니다. 파이썬 비즈니스 요구를 충족시키기위한 맞춤형 솔루션을 만들기위한 통찰력을 얻으십시오.
특징 및 기능
Aspose.OCR for Python via .NET .NET를 통해 Python의 ASSPER.Ocr은 작업을 빠르고 쉽게 해결합니다.
사진 OCR
스캔 레벨 정확도로 스마트 폰 사진에서 텍스트를 추출하십시오.
검색 가능한 PDF
모든 스캔을 완전히 검색 가능하고 색인 가능하며 편집 가능한 문서로 변환하십시오.
URL 인식
로컬로 다운로드하지 않고 URL에서 이미지를 인식하십시오.
대량 인식
다중 페이지 문서, 폴더 및 아카이브의 모든 이미지를 읽으십시오.
모든 글꼴과 스타일
모든 인기있는 서체와 스타일에서 텍스트를 식별하고 인식하십시오.
미세 조정 인식
최상의 인식 결과를 위해 모든 OCR 매개 변수를 조정하십시오.
맞춤법 검사기
잘못된 철자를 자동으로 수정하여 결과를 향상시킵니다.
이미지에서 텍스트를 찾으십시오
이미지 세트 내에서 텍스트 또는 정규 표현식을 검색하십시오.
이미지 텍스트를 비교하십시오
케이스 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교하십시오.
파이썬 코드 샘플
코드 샘플을 탐구하여 OCR을 Python 응용 프로그램에 원활하게 통합하십시오.
설치
.NET를 통해 Python 용으로 Python 휠 또는 자체 포함 된 다운로드 가능한 패키지로 배포됩니다. Python Project에 대한 통합은 선호하는 Python Integrated Development Environment (IDE)에서 직접 통합하는 것이 원활한 프로세스입니다. 간단히 설치하면 전체 범위의 OCR 기능을 활용하여 다양한 형식으로 인식 결과를 저장할 준비가되어 있습니다.
설치 후. 임시 라이센스는 30 일 동안 모든 시험판 제한을 들어 올립니다. 이 기간을 활용하여 완전히 기능적인 OCR 응용 프로그램의 개발을 시작하여 후기 단계에서 .NET를 통해 Python의 구매에 대한 정보에 근거한 결정을 내릴 수 있습니다.
로드 라이센스
lic = License()
lic.set_license(self.licPath)
사진에서 텍스트를 인식합니다
Python의 Aspose OCR의 모든 내용에서 텍스트를 읽는 것은 보편적 인 인식 방법을 호출하는 것만 큼 쉽습니다.
사진을 텍스트 - 파이썬으로 변환하십시오
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
파이썬 범용 변환기
API는 스캐너, 카메라 또는 스마트 폰 (PDF 문서, JPEG, PNG, TIFF, GIF, BMP 이미지 및 DJVU 파일)의 이미지를 적합하게 읽습니다. 다중 페이지 PDF 문서, TIFF 및 DJVU 이미지에 대한 완전한 지원은 다양성을 보장합니다. URL을 통해 웹에서 이미지를 제공 할 수도 있습니다.
인식 결과는 대중 문서 및 데이터 교환 형식으로 반환됩니다 : 일반 텍스트, PDF, Microsoft Word, Microsoft Excel, JSON 및 XML.
PDF 인식 및 다양한 출력 형식으로 결과를 저장 -Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
파이썬의 리소스 최적화
광학 문자 인식은 자원을 요구합니다. 우리의 API는 고전적인 타임 가격 품질 트라이어드의 균형을 맞출 수있는 유연한 방법을 제공합니다.
- 철저한 인식과 빠른 인식을 선택하십시오.
- 인식을 위해 할당 된 스레드 수를 지정하거나 라이브러리가 프로세서 코어 수로 자동 스케일링하도록 허용하십시오.
- .NET 백엔드에 계산을 오프로드하여 CPU를 확보하십시오.
빠른 인식 - 파이썬
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
한 줄을 인식하십시오
이미지가 이미 단일 텍스트 라인으로 트림 된 경우 자동 수정, 컨텐츠 구조 감지 및 기타 리소스 소비 단계없이 가능한 가장 빠른 모드에서 인식 할 수 있습니다. OCR 속도를 정상 인식 프로세스보다 최대 7 배 빠르게 할 수 있습니다.
이미지 -Python에서 한 줄의 텍스트 라인을 인식하십시오
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)