왜 .NET용 Aspose.OCR인가요?

.NET용 Aspose.OCR은 광학 문자 인식을 위한 강력하고 개발자 친화적이며 비용 효율적인 API입니다. 10줄 미만의 기본 C# 코드로 .NET 데스크톱 솔루션, MVC 기반 웹 애플리케이션, 클라우드 서비스 및 서버리스 Azure 기능에 OCR 기능을 구축할 수 있습니다. 스캔, 사진 및 스크린샷에서 기계가 읽을 수 있는 텍스트를 추출하고, 스캔한 페이지를 검색 및 색인 생성이 가능한 PDF로 변환하고, 복잡한 수학, 신경망 및 기타 기술적 복잡성이 아닌 비즈니스 작업에 초점을 맞춘 이미지의 텍스트를 찾아 비교합니다. 아래 항목을 클릭하여 당사의 기능과 이점에 대해 자세히 알아보세요.

Illustration ocr

글로벌 애플리케이션

6,000개 이상의 중국어 문자와 힌디어를 포함하여 라틴어, 키릴 문자 및 아시아 문자로 된 텍스트를 인식합니다.

모든 것을 읽으십시오

스캐너나 카메라를 통해 얻은 모든 파일에서 텍스트를 검색하고 웹 링크에서 직접 이미지를 처리합니다.

신뢰할 수 있는 결과

초점이 맞지 않거나 회전되거나 왜곡되거나 노이즈가 있는 이미지를 포함한 모든 이미지에 대해 높은 인식 정확도를 달성합니다.

일괄 인식

폴더 및 아카이브의 모든 이미지를 일괄 인식합니다. 여러 페이지로 구성된 PDF 문서와 TIFF 이미지를 읽어보세요.

레이아웃 감지

레이아웃에 관계없이 추출된 텍스트의 올바른 순서를 보장하기 위해 이미지의 콘텐츠 블록을 식별하고 분류합니다.

라이브 코드 샘플

광학 문자 인식은 Aspose.OCR을 사용하면 기술을 처음 접하는 개발자에게도 사소하고 간단한 작업이 됩니다. 단 몇 줄의 코드만으로 이미지에서 텍스트를 추출하여 화면에 표시할 수 있습니다. 정말 간단합니다. 한번 시도해 보세요.

인식 준비 완료 인식 준비 완료 여기에 파일을 놓거나 클릭하여 찾아보세요 *

* 파일을 업로드하거나 서비스를 이용함으로써 귀하는 당사의 약관에 동의하게 됩니다. 이용약관 그리고 개인 정보 정책.

인식결과
 

이미지를 텍스트로 변환

더 많은 예시 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

플랫폼 독립성

.NET용 Aspose.OCR은 로컬에 있든 .NET, .NET Core 또는 .NET Framework를 지원하는 모든 플랫폼 에서 작동할 수 있습니다. 컴퓨터, 웹 서버 또는 클라우드에서.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

지원되는 파일 형식

Aspose.OCR for .NET 거의 모든 [파일]로 작업할 수 있습니다.( https://docs.aspose.com/ocr/net/supported-file-formats/ ) 스캐너나 카메라에서 얻을 수 있습니다. 인식 결과는 저장하거나 데이터베이스로 가져오거나 실시간으로 분석할 수 있는 가장 널리 사용되는 파일 및 데이터 교환 형식으로 반환됩니다.

이미지

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

일괄 OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

인식결과

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

어떤 콘텐츠에도 적합

텍스트 인식의 정확성과 신뢰성은 원본 이미지의 품질에 크게 좌우됩니다. .NET용 Aspose.OCR은 이미지가 OCR 엔진으로 전송되기 전에 이미지를 향상시키는 광범위한 완전 자동 및 수동 이미지 처리 필터를 제공합니다.

강력한 이미지 처리 및 사용자 정의 가능한 콘텐츠 구조 감지 알고리즘을 통해 고품질 스캔부터 거리 사진까지 거의 모든 이미지에서 텍스트를 추출할 수 있습니다. 최상의 인식 품질을 얻기 위해 동일한 이미지에 여러 처리 필터를 적용할 수 있습니다.

자원 최적화

.NET용 Aspose.OCR은 각 특정 사용 사례에 대해 인식 속도, 품질 및 리소스 활용률의 균형을 매우 유연하게 유지합니다.

  • 철저한 인식과 빠른 인식 중에서 선택하세요.
  • 인식을 위해 할당된 스레드 수를 지정하거나 라이브러리가 프로세서 코어 수에 맞게 자동으로 확장되도록 허용합니다.
  • 계산을 GPU로 오프로드하여 CPU를 확보합니다.

28개 인식 언어

.NET용 Aspose.OCR은 글로벌 규모의 문서 처리, 데이터 추출 및 콘텐츠 디지털화를 위한 범용 솔루션입니다. 광범위한 유럽 및 아시아 작문 스크립트를 지원하므로 모든 규모에 잘 적응하여 중소기업은 물론 다국적 기업 모두에 적합합니다.

언어 감지를 라이브러리에 위임하거나 수동으로 언어를 지정하여 인식 성능과 신뢰성을 높일 수 있습니다. 다음 언어가 지원됩니다:

  • 확장 라틴어 알파벳: 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어, 에스토니아어, 핀란드어, 프랑스어, 독일어, 이탈리아어, 라트비아어, 리투아니아어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 슬로바키아어, 슬로베니아어, 스페인어, 스웨덴어;
  • 키릴 문자 알파벳: 벨로루시어, 불가리아어, 카자흐어, 러시아어, 세르비아어, 우크라이나어;
  • 6,000개 이상의 중국어 문자;
  • 힌디 어.

특징 및 성능

.NET용 Aspose.OCR은 사진이나 스캔한 이미지에서 자동으로 텍스트를 추출하므로 문서를 수동으로 다시 입력할 필요가 없습니다.

Feature icon

사진 OCR

스캔 수준의 정확도로 스마트폰 사진에서 텍스트를 추출합니다.

Feature icon

검색 가능한 PDF

모든 스캔을 검색 및 색인 생성이 가능한 문서로 변환하세요.

Feature icon

URL 인식

로컬로 다운로드하지 않고도 URL에서 이미지를 인식합니다.

Feature icon

대량 인식

여러 페이지로 구성된 문서, 폴더 및 아카이브에서 모든 이미지를 읽습니다.

Feature icon

모든 글꼴 및 스타일

널리 사용되는 모든 서체와 스타일의 텍스트를 식별하고 인식합니다.

Feature icon

인식 미세 조정

최상의 인식 결과를 얻으려면 모든 OCR 매개변수를 조정하세요.

Feature icon

맞춤법 검사기

철자가 틀린 단어를 자동으로 수정하여 결과를 개선합니다.

Feature icon

이미지에서 텍스트 찾기

이미지 세트 내에서 텍스트 또는 정규식을 검색합니다.

Feature icon

이미지 텍스트 비교

대소문자 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교합니다.

사용하기 쉬운

이미지를 텍스트로 변환하고, 검색 가능한 PDF를 만들고, 인식 결과를 문서에 저장하는 등의 작업에는 몇 줄의 코드만 있으면 됩니다. .NET용 Aspose.OCR을 솔루션에 통합하는 방법을 이해하려면 코드 샘플을 살펴보세요.

설치

.NET용 Aspose.OCR은 NuGet 패키지 또는 다운로드 가능한 파일 로 배포됩니다. ocr/net/)은 최소한의 종속성을 갖습니다. Microsoft Visual Studio에서 직접 프로젝트에 패키지를 추가할 수 있습니다. 프로젝트에 설치하기만 하면 이미지에서 텍스트를 추출하고 지원되는 형식으로 인식 결과를 저장할 수 있습니다. 시스템에 CUDA 지원 GPU가 있는 경우 GPU 가속 OCR 엔진 을 사용하여 인식 성능을 크게 높일 수 있습니다.

몇 가지 제한 사항 을 적용하면 설치 후 바로 Aspose.OCR for .NET을 사용할 수 있습니다. 임시 라이센스는 30일 동안 평가판의 모든 제한을 제거합니다. 이를 사용하여 완전한 기능을 갖춘 OCR 애플리케이션 구축을 시작하고 나중에 .NET용 Aspose.OCR 구매에 대한 최종 결정을 내리세요.

사진에서 텍스트 추출

사람들이 일반적으로 OCR(광학 문자 인식)을 생각할 때 가장 먼저 떠오르는 것은 주로 기본 캡처 장치인 스캐너입니다. 이러한 연관성은 역사적 이유가 있으며 여전히 많은 상황에서 널리 퍼져 있으며, 비교할 수 없는 품질로 실제 문서에서 인쇄된 텍스트를 캡처하기 위한 일관되고 통제된 환경을 제공합니다. 그러나 스캐너는 항상 가까이에 있지 않으며 작동하려면 고정된 워크스테이션이 필요한 특수 장비입니다. 다행스럽게도 현대 사회에서는 기존 스캐너에 대한 편리한 대안인 스마트폰 카메라를 제공합니다. 스마트폰 카메라 기술의 발전으로 보급형 스마트폰이라도 OCR 지원 문서를 캡처할 수 있는 충분한 품질을 제공할 수 있습니다. 내장 메모리를 사용하면 이동 중에도 대량의 문서, 신문, 책, 거리 표지판 및 기타 텍스트를 그 어느 때보다 쉽게 ​​디지털화할 수 있습니다. 필요한 것은 사진을 기계가 읽을 수 있는 텍스트로 변환하는 데 적합한 기술뿐입니다.

Aspose.OCR for .NET은 기본적으로 모든 유형의 이미지를 인식하도록 특별히 설계되었으며 품질이 낮은 사진도 처리할 수 있도록 추가로 미세 조정할 수 있습니다. 최신 스마트폰과 결합하면 대부분의 일상적인 스캔 및 텍스트 인식 작업을 위한 강력한 OCR 응용 프로그램을 만들 수 있습니다. 가장 진보된 이미지 처리 및 문서 구조 분석이 몇 줄의 코드로 수행되므로 복잡한 수학적 알고리즘, 신경망 및 기타 기술적 복잡성이 아닌 비즈니스에 집중할 수 있습니다.

사진 OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

스캔에서 검색 가능한 PDF 만들기

PDF는 특히 여러 페이지를 단일 파일로 결합할 수 있는 기능으로 인해 종이 문서를 스캔하는 데 가장 널리 사용되는 형식 중 하나입니다. 이 형식은 개인, 기업, 은행 및 정부 기관 간의 계약서, 송장, 법률 문서, 여권, ID 카드 및 기타 다양한 문서를 교환하는 데 널리 사용됩니다. 그러나 스캔한 PDF는 기본적으로 이미지 모음입니다. 여기에는 기계가 읽을 수 있는 텍스트가 포함되어 있지 않으므로 사용자는 문서 내용을 검색, 복사 또는 조작할 수 없습니다.

Aspose.OCR for .NET은 스캔한 PDF를 검색 및 색인 생성이 가능한 문서로 변환하는 빠르고 쉽고 안정적인 방법을 제공합니다. 페이지 콘텐츠를 정확하게 인식하여 원본 이미지 위에 기계가 읽을 수 있는 텍스트 레이어로 변환합니다. 이 레이어는 선택, 복사, 텍스트 음성 변환 소프트웨어로 읽을 수 있으며 번역자, 요약자 및 기타 AI 기반 분석을 통해 자동으로 처리될 수도 있습니다. 도구.

PDF에 텍스트 오버레이 추가 - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

이미지에서 텍스트 검색

특히 대규모 조직의 디지털 아카이브는 방대한 스캔 및 사진 컬렉션으로 구성되는 경우가 많으며 그 중 다수에는 여러 페이지의 문서가 포함될 수 있습니다. 정보를 쉽게 검색하고 탐색하려면 이러한 아카이브를 효과적으로 관리하고 구성하는 것이 필수적입니다. 그러나 이미지에는 기계가 읽을 수 있는 텍스트가 포함되어 있지 않으므로 문서 내용을 검색하고 분석하는 것이 불가능합니다.

Aspose.OCR for .NET을 사용하면 글꼴, 텍스트 크기, 스타일 및 기타 매개변수에 관계없이 이미지의 텍스트를 쉽게 검색할 수 있습니다. 또한 라이브러리는 대소문자를 구분하지 않는 검색과 정규식을 지원하므로 다양한 애플리케이션과 산업에 매우 유용합니다. 이 기능은 텍스트에서 발견된 내용, 키워드 또는 패턴을 기반으로 문서를 분류하는 데 사용할 수 있습니다. 계약 및 계약 내의 특정 조건이나 조항을 검색합니다. 키워드나 그 안에 있는 콘텐츠를 기반으로 파일을 재구성합니다. 문서 내에서 개인 데이터를 찾아 식별함으로써 GDPR 준수를 더욱 쉽게 보장하고 민감한 정보를 보다 효과적으로 관리할 수 있습니다. 또한 이미지를 검색하면 자동화된 워크플로우를 생성하고 서명된 계약서 및 송장을 받을 때 다양한 비즈니스 프로세스를 간소화할 수 있습니다.

이미지에서 텍스트 검색 - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}