Aspose.OCR  for .NET

.NET에서 이미지와 PDF를 텍스트로 변환

몇 줄의 코드로 .NET 애플리케이션에 OCR(광학 문자 인식)을 추가합니다.

  Download Free Trial
  
 

.NET용 Aspose.OCR은 광학 문자 인식을 위한 강력하면서도 사용하기 쉽고 비용 효율적인 API입니다. 이를 통해 복잡한 수학, 신경망 및 기타 기술 세부 사항에 대해 걱정할 필요 없이 5줄 미만의 코드로 .NET 애플리케이션에 OCR 기능을 추가할 수 있습니다. 기계 학습 기술과 수년간의 개발 경험을 통해 중국어 는 물론 라틴어키릴 문자 를 기반으로 하는 26 개 언어를 지원하는 탁월한 속도와 정확성을 갖춘 OCR 엔진이 탄생했습니다. OCR API는 스캔한 이미지, 스마트폰 사진, 스크린샷, 이미지 영역 및 스캔한 PDF를 인식하고 가장 널리 사용되는 문서 및 데이터 교환 형식으로 결과를 반환할 수 있습니다. 다양한 전처리 필터를 사용하여 회전, 기울어진 이미지 및 노이즈가 있는 이미지를 인식할 수 있습니다. 리소스 집약적인 계산 작업을 GPU 로 전송하여 인식 성능과 시스템 부하를 더욱 향상시킬 수 있습니다.

.NET용 Aspose.OCR의 특징 및 기능

이미지와 PDF를 텍스트로 변환

스캐너 또는 카메라에서 얻을 수 있는 모든 이미지 형식 지원

라틴어 및 키릴 자모 기반 언어 읽기

6,000개 이상의 한자 인식

모든 인기 있는 서체 감지 및 인식

글꼴 스타일과 서식을 신중하게 유지

전체 이미지 또는 선택한 영역만 처리

회전, 왜곡 및 노이즈가 있는 이미지 지원

폴더 또는 아카이브에 있는 모든 이미지의 일괄 인식

웹 링크로 제공되는 이미지 인식

철자가 틀린 단어를 찾아 자동으로 수정합니다.

다른 Aspose 제품과 완벽하게 호환

쉬운 설치

.NET용 Aspose.OCR은 가벼운 NuGet 패키지 또는 최소한의 종속성이 있는 다운로드 가능한 파일 로 배포됩니다. 프로젝트에 설치 하기만 하면 지원되는 모든 언어로 된 텍스트를 인식하고 지원되는 형식으로 인식 결과를 저장할 수 있습니다.

제한 및 제한 없이 완전한 기능을 갖춘 OCR 애플리케이션 구축을 시작하려면 임시 라이선스를 요청하십시오 .

사용하기 쉬운

이미지를 인식하고 결과를 표시하려면 줄의 코드가 필요합니다. 예, 정말 간단합니다!

3줄의 이미지를 텍스트로 - C#

// OCR 엔진 초기화
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 이미지를 텍스트로 인식
string result = recognitionEngine.RecognizeImage("sample.jpg");

// 인식 결과 표시
Console.WriteLine(result);

크로스 플랫폼

라이브러리는 .NET Standard 2.0을 완벽하게 지원합니다. 이는 애플리케이션이 데스크톱 Windows, Windows Server, macOS, Linux 및 클라우드와 같은 모든 플랫폼에서 실행될 수 있음을 의미합니다.

26개의 인식 언어

OCR API는 혼합 언어의 텍스트를 포함하여 많은 수의 언어와 모든 인기 있는 쓰기 스크립트를 인식할 수 있습니다.

  • 확장 라틴 알파벳 : 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어, 에스토니아어, 핀란드어, 프랑스어, 독일어, 이탈리아어, 라트비아어, 리투아니아어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 슬로바키아어, 슬로베니아어, 스페인어, 스웨덴어.
  • 키릴 문자 : 벨로루시어, 불가리아어, 카자흐어, 러시아어, 세르비아어, 우크라이나어.
  • 중국어 : 6,000자 이상.

언어 감지를 라이브러리에 맡기거나 언어를 직접 정의하여 인식 성능과 안정성을 높일 수 있습니다.

사진 인식

OCR 응용 프로그램의 가장 큰 장벽은 스캐너가 최종 사용자에게 흔하지 않다는 것입니다. API에는 회전, 왜곡 및 노이즈가 있는 이미지를 처리할 수 있는 강력한 내장 이미지 사전 처리 필터가 있습니다. 모든 이미지 형식에 대한 지원과 함께 스마트폰 사진도 안정적으로 인식할 수 있습니다. 대부분의 전처리 및 이미지 보정이 자동으로 이루어지므로 어려운 경우에만 개입하면 됩니다.

자동 이미지 수정 적용 - C#

// OCR 엔진 초기화
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 자동 기울기 계산 및 대비 활성화
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// 이미지 인식
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

범용 변환기

API는 PDF 문서, JPEG, PNG, TIFF, GIF, BMP 이미지, DjVu 파일 등 스캐너, 카메라 또는 스마트폰에서 얻을 수 있는 모든 이미지를 문자 그대로 읽을 수 있습니다. 다중 페이지 PDF 문서, TIFF 및 DjVu 이미지가 완벽하게 지원됩니다. URL을 통해 웹에서 이미지를 제공할 수도 있습니다.

인식 결과는 가장 널리 사용되는 문서 및 데이터 교환 형식(일반 텍스트, PDF, Microsoft Word, Microsoft Excel, JSON 및 XML)으로 반환됩니다.

PDF를 인식하고 결과를 JSON에 저장 - C#

// OCR 엔진 초기화
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 스캔한 PDF의 모든 페이지 인식
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// 각 페이지를 JSON으로 출력
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

리소스 최적화

광학 문자 인식은 리소스 집약적인 프로세스입니다. API는 고전적인 시간-가격-품질 트라이어드에서 균형을 맞추는 매우 유연한 방법을 제공합니다.

  • 철저한 인식과 빠른 인식 중에서 선택하세요.
  • 인식을 위해 할당된 스레드 수를 지정하거나 라이브러리가 프로세서 코어 수에 맞게 자동으로 확장되도록 합니다.
  • 계산을 GPU로 오프로드하여 CPU를 확보하십시오.

빠른 인식 - C#

// OCR 엔진 초기화
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 가장 빠른 모드에서 이미지 인식
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

맞춤법 검사

OCR은 신뢰할 수 있는 결과를 생성하지만 먼지 및 인쇄 결함으로 인해 일부 기호가 잘못 인식될 수 있습니다. OCR API에는 맞춤법이 틀린 단어를 자동으로 대체하는 맞춤법 검사기가 내장되어 있어 인식 결과를 수동으로 수정할 필요가 없습니다.

맞춤법 검사 인식 결과 - C#

// OCR 엔진 초기화
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 자동 대비 활성화
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// 이미지 인식
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// 철자가 틀린 단어 수정
string text =  result.GetSpellCheckCorrectedText();

일괄 처리

OCR API는 한 번의 호출로 여러 이미지를 인식할 수 있는 다양한 일괄 처리 방법을 제공하여 모든 이미지를 하나씩 인식할 필요가 없습니다.

  • 다중 페이지 PDF, TIFF 및 DjVu 파일 인식.
  • 폴더의 모든 파일 인식.
  • 아카이브의 모든 파일 인식.
  • 목록의 모든 파일 인식.

사례로 배우기

.NET용 Aspose.OCR에는 기능과 기능에 빠르게 익숙해지고 비즈니스 요구 사항에 맞는 솔루션을 만드는 아이디어를 얻을 수 있도록 C#으로 작성된 여러 예제 가 함께 제공됩니다.

  
  

Aspose는 다른 인기 있는 프로그래밍 언어에 대한 기본 OCR API도 제공합니다.