Python용 광학 문자 인식 API

스캔한 이미지, 사진 및 스크린샷에서 텍스트를 추출하고, 검색 가능한 PDF를 만들고, 이미지의 텍스트를 검색 및 비교하는 등 Python 애플리케이션에서 더 많은 작업을 수행합니다.

Aspose.OCR for Python via .NET Python 애플리케이션 및 노트북을 위한 강력하면서도 사용하기 쉬운 광학 문자 인식(OCR) 엔진입니다. 10줄 미만의 코드로 라틴어, 키릴 문자 및 아시아 스크립트를 기반으로 28개의 언어로 된 텍스트를 인식하여 가장 많이 사용되는 문서 및 데이터 교환 형식으로 결과를 반환할 수 있습니다. 복잡한 수학적 모델을 학습하고, 기계 학습 알고리즘을 구축하고, 신경망을 교육할 필요가 없습니다. 우리의 간단하고 강력한 API가 당신을 위해 모든 것을 할 것입니다.

라이브러리는 고품질 스캔에서 스마트폰의 빠른 사진에 이르기까지 모든 소스에서 동일하게 잘 작동합니다. 이미지가 회전, 왜곡 또는 잡음이 있는지 여부 — 자동 전처리 및 후처리 필터는 최단 시간에 최고의 인식 정확도를 제공합니다.

한눈에

모든 이미지 유형에서 주요 유럽 및 아시아 언어로 된 텍스트 추출

이미지 유형

사진
도서
기사
계약
신분증
여권
영수증
인보이스
번호판
기타...

지원되는 언어

영어
중국어
힌디어
독일어
프랑스어
스페인어
러시아어
이탈리아어
폴란드어
기타...

Aspose.OCR

플랫폼 독립성

Aspose.OCR for Python via .NET Python 버전 3.6 이상에서 작동

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

지원되는 파일 형식

스캐너, 카메라 또는 인터넷의 모든 이미지를 가장 널리 사용되는 문서 및 데이터 교환 형식으로 변환

소스 파일

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

인식 결과

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

기능 및 기능

스캔, 사진 및 스크린샷에서 텍스트 추출

스캔한 PDF를 검색 및 색인 생성이 가능한 PDF로 변환

모든 대중적인 서체로 된 라틴어, 키릴 문자 및 아시아 스크립트 읽기

6,000개 이상의 한자를 인식합니다.

흐릿하고 왜곡되고 회전되고 노이즈가 많은 이미지 작업

원본 텍스트 레이아웃에서 콘텐츠 블록 식별 및 보존

이미지의 영역 감지 및 읽기: 단락, 줄 및 단일 단어

대량 처리 다중 페이지 문서, 폴더 및 아카이브

다운로드 없이 인터넷에서 이미지 인식

철자가 틀린 단어를 식별하고 자동으로 수정

이미지에서 텍스트를 찾고 이미지 텍스트를 지능적으로 비교

사용하기 쉬운

이미지를 인식하고 결과를 표시하려면 5줄의 코드만 있으면 됩니다. 예, 정말 간단합니다!

인식 준비 완료 인식 여기에 파일을 놓거나 클릭하여 찾아보기 *

* 파일을 업로드하거나 서비스를 사용함으로써 귀하는 당사에 동의합니다. 이용 약관 및 개인 정보 정책.

라이브 코드 샘플 - Python 3

# OCR 엔진 초기화
recognitionEngine = AsposeOcr()
# 배치에 이미지 추가
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# 이미지에서 텍스트 추출
result = recognitionEngine.recognize(input)
# 인식 결과 표시
print(result[0].recognition_text)

Recognition result

28개 인식 언어

Aspose.OCR for Python via .NET은 다양한 언어와 혼합 언어 텍스트를 포함하여 널리 사용되는 모든 쓰기 스크립트를 인식할 수 있습니다.

확장 라틴 알파벳: 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어(손으로 쓴 스크립트 포함), 에스토니아어, 핀란드어, 프랑스어, 독일어, 이탈리아어, 라트비아어, 리투아니아어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어 , 슬로바키아어, 슬로베니아어, 스페인어, 스웨덴어.
키릴 문자: 벨로루시어, 불가리아어, 카자흐어, 러시아어, 세르비아어, 우크라이나어.
중국어: 6,000자 이상
힌디어

OCR 엔진에서 직접 지원하지 않는 경우에도 확장 라틴어 및 키릴 자모를 기반으로 하는 다른 언어로 된 텍스트를 읽을 수도 있습니다. 예를 들어 라틴어, 베트남어, 게일어 등

강력한 처리 필터

광학 문자 인식의 정확성과 신뢰성은 원본 이미지의 품질에 크게 좌우됩니다. Aspose.OCR for Python via .NET은 OCR 엔진으로 전송되기 전에 이미지를 향상시키는 수많은 완전 자동화 및 수동 이미지 처리 필터를 제공합니다.

수평에 대해 약간의 각도로 정렬된 이미지를 자동으로 똑바르게 합니다.
심하게 기울어진 이미지를 수동으로 회전합니다.
먼지, 반점, 긁힘, 눈부심, 원치 않는 그라데이션 및 기타 노이즈를 자동으로 제거합니다.
이미지 대비를 자동으로 조정합니다.
이미지를 자동으로 확대하거나 수동으로 크기를 조정합니다.
이미지를 흑백 또는 회색조로 변환합니다.
밝은 부분은 어둡게, 어두운 부분은 밝게 나타나도록 이미지 색상을 반전합니다.
이미지의 문자 두께를 늘립니다.
글자의 가장자리를 유지하면서 노이즈가 많은 이미지를 흐리게 합니다.
페이지 곡률을 곧게 펴고 페이지 사진의 카메라 렌즈 왜곡을 수정합니다.

이러한 필터는 일괄 처리뿐만 아니라 전체 이미지 또는 이미지의 선택한 영역에만 결합 및 적용할 수 있습니다. 인식 파이프라인에서 사전 처리를 미세 조정할 수 있을 뿐만 아니라 표시, 캐싱 및 디버깅을 위해 처리된 이미지를 저장할 수도 있습니다.

특정 문서 유형에 최적화됨

Aspose.OCR for Python via .NET은 최대 정확도로 특정 유형의 이미지에서 텍스트를 추출하기 위해 특별히 훈련된 신경망을 제공합니다.

스캔하거나 사진을 찍은 신분증 및 여권.
차량 번호판.
인보이스.
영수증.

내장 맞춤법 검사기

Aspose.OCR for Python via .NET은 높은 인식 정확도를 제공하지만 인쇄 결함, 먼지 또는 비표준 글꼴로 인해 특정 문자나 단어가 잘못 인식될 수 있습니다. 인식 결과를 더욱 개선하려면 선택한 인식 언어를 기반으로 맞춤법 오류를 찾아 자동으로 수정하는 맞춤법 검사기를 켤 수 있습니다.

인식된 텍스트에 특수 용어, 약어 및 일반 철자 사전에 없는 기타 단어가 포함된 경우 자신만의 단어 목록을 제공할 수 있습니다.

검색 가능한 PDF 만들기

인식 정확도가 가장 높더라도 원본 이미지에는 중요한 비텍스트 정보가 많이 포함되어 있거나 단순히 역사적 가치가 있을 수 있습니다. Aspose.OCR for Python via .NET은 두 세계의 장점을 결합하는 간단하고 우아한 솔루션을 제공합니다. 이미지, PDF 문서 또는 파일 패키지에서 텍스트를 추출하여 원본 이미지 위에 보이지 않는 텍스트 레이어로 배치합니다. 결과는 문서 저장 및 공유를 위한 업계 표준인 PDF 형식으로 저장됩니다. 결과 파일은 검색 및 인덱싱이 가능하며 원본 문자를 선택하여 복사한 것과 동일한 방식으로 텍스트를 선택하여 복사할 수 있습니다.

일괄 인식

Aspose.OCR for Python via .NET을 사용하면 번호와 유형에 관계없이 단일 이미지를 읽는 것처럼 간단하게 여러 파일을 인식할 수 있습니다. 단일 API 호출로 자동 공급 스캐너에서 여러 페이지를 인식하거나 자동 교통 카메라에서 차량 번호판을 추출할 수 있습니다.

결과는 검색 가능한 PDF 문서 또는 스프레드시트로 저장하거나 추가 분석을 위해 일반 텍스트, JSON 또는 XML로 반환할 수 있습니다.

Support and Learning Resources

왜 Aspose.OCR for Python via .NET?
고객 목록
성공 사례

Download Free Trial Pricing Information

Aspose는 또한 다른 인기 있는 프로그래밍 언어에 대한 기본 OCR API를 제공합니다.

Python용 광학 문자 인식 API

스캔한 이미지, 사진 및 스크린샷에서 텍스트를 추출하고, 검색 가능한 PDF를 만들고, 이미지의 텍스트를 검색 및 비교하는 등 Python 애플리케이션에서 더 많은 작업을 수행합니다.

Aspose.OCR for Python via .NET

Overview

한눈에

플랫폼 독립성

지원되는 파일 형식

기능 및 기능

사용하기 쉬운

라이브 코드 샘플 - Python 3

28개 인식 언어

강력한 처리 필터

특정 문서 유형에 최적화됨

내장 맞춤법 검사기

검색 가능한 PDF 만들기

일괄 인식

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET