.NET 애플리케이션용 C# OCR 라이브러리
C# OCR에서 이미지를 텍스트로 변환
더 많은 쇼케이스 >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Aspose OCR 라이브러리를 선택하는 이유는 무엇입니까?
몇 초 만에 .NET 앱에 강력한 OCR 기능을 구축하세요. 사용하기 쉬운 OCR API를 사용하면 이미지 및 스캔에서 텍스트를 추출하고, 검색 가능한 PDF를 생성하는 등 최소한의 C# 코드를 사용할 수 있습니다. .NET 데스크톱, 웹, 클라우드 및 서버리스 기능에 적합합니다. 아래 항목을 클릭하여 당사의 기능과 이점에 대해 자세히 알아보세요.
글로벌 OCR 애플리케이션
C# OCR은 영어, 키릴 문자, 아랍어, 페르시아어, 중국어, 일본어, 한국어, 힌디어, 타밀어 및 혼합 언어 텍스트를 인식합니다.
모든 것을 읽으십시오
스캐너나 카메라를 통해 얻은 모든 파일에서 텍스트를 가져오고 웹 링크에서 직접 이미지를 처리합니다.
신뢰할 수 있는 결과
초점이 맞지 않거나 회전되거나 왜곡되거나 노이즈가 있는 이미지를 포함한 모든 이미지에 대해 높은 인식 정확도를 달성합니다.
일괄 인식
폴더 및 아카이브의 모든 이미지를 일괄 인식합니다. 여러 페이지로 구성된 PDF 문서와 TIFF 이미지를 읽어보세요.
레이아웃 감지
레이아웃에 관계없이 추출된 텍스트의 올바른 순서를 보장하기 위해 이미지의 콘텐츠 블록을 식별하고 분류합니다.
라이브 코드 샘플
.NET OCR은 Aspose OCR API를 사용하면 새로운 개발자에게도 사소하고 간단한 작업이 됩니다. 단 몇 줄의 코드만으로 이미지에서 텍스트를 추출하여 화면에 표시할 수 있습니다. 정말 간단합니다. 한번 시도해 보세요.
* 파일을 업로드하거나 서비스를 이용함으로써 귀하는 당사의 약관에 동의하게 됩니다. 이용약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환
더 많은 예 >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
플랫폼 독립성
크로스 플랫폼 OCR 라이브러리는 .NET, .NET Core 또는 .NET Framework에서 어디서나 작동할 수 있습니다. 웹 서버 또는 클라우드.
지원되는 파일 형식
Aspose.OCR for .NET 모든 [파일]로 작업할 수 있습니다.( https://docs.aspose.com/ocr/net/supported-file-formats/ ) 스캐너나 카메라에서 얻을 수 있습니다. 인식 결과를 저장하거나 데이터베이스로 가져오거나 실시간으로 분석할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- BMP
- GIF
일괄 OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
인식결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
어떤 콘텐츠에도 적합
C#의 텍스트 인식의 정확성과 신뢰성은 이미지 품질에 크게 좌우됩니다. .NET OCR은 자동화 및 수동 이미지 최적화 전체 세트를 제공하여 탁월한 인식 결과를 보장합니다.
강력한 이미지 처리, 완전히 사용자 정의 가능한 텍스트 감지, 사후 처리 및 자동 철자 교정을 통해 모든 스캔 또는 사진에서 가장 정확하게 텍스트를 추출할 수 있습니다.
OCR 리소스 최적화
Aspose의 C# OCR 라이브러리를 사용하면 각 특정 사용 사례에 대해 인식 속도, 품질 및 리소스 활용도의 균형을 매우 유연하게 조정할 수 있습니다.
- 철저한 인식과 빠른 인식 중에서 선택하세요.
- 인식을 위해 할당된 스레드 수를 지정하거나 .NET OCR 라이브러리가 프로세서 코어 수에 맞게 자동으로 확장되도록 허용합니다.
- 계산을 GPU로 오프로드하여 CPU를 확보합니다.
140개 이상의 인식 언어
당사의 C# OCR 라이브러리는 글로벌 규모의 문서 처리, 데이터 추출 및 콘텐츠 디지털화를 위한 범용 솔루션입니다. 광범위한 유럽, 중동 및 아시아 작문 스크립트를 지원하므로 모든 국가 및 비즈니스에 잘 적용됩니다.
중국어/영어, 아랍어/프랑스어, 키릴어/영어 등 혼합 언어로 작성된 문서를 인식할 수 있습니다. 다음 언어가 지원됩니다:
- 확장 라틴어: 영어, 스페인어, 프랑스어, 인도네시아어, 포르투갈어, 독일어, 베트남어, 터키어, 이탈리아어, 폴란드어 외 80개 이상;
- 키릴 문자 알파벳: 러시아어, 우크라이나어, 카자흐어, 불가리아어(키릴/영어 혼합 텍스트 포함)
- 아랍어, 페르시아어, 우르두어(영어와 혼합된 텍스트 포함)
- 중국어, 한국어, 일본어, 데바나가리어, 드라비다어(힌디어, 타밀어, 마라티어 등)
특징 및 성능
C# OCR은 사진이나 스캔에서 자동으로 텍스트를 추출하므로 문서를 수동으로 다시 입력할 필요가 없습니다.
사진 OCR
스캔 수준의 정확도로 스마트폰 사진에서 텍스트를 추출합니다.
검색 가능한 PDF
모든 스캔을 검색 및 색인 생성이 가능한 문서로 변환하세요.
URL 인식
로컬로 다운로드하지 않고도 URL에서 이미지를 인식합니다.
대량 인식
여러 페이지로 구성된 문서, 폴더 및 아카이브에서 모든 이미지를 읽습니다.
모든 글꼴 및 스타일
널리 사용되는 모든 서체와 스타일의 텍스트를 식별하고 인식합니다.
인식 미세 조정
최상의 인식 결과를 얻으려면 모든 OCR 매개변수를 조정하세요.
맞춤법 검사기
철자가 틀린 단어를 자동으로 수정하여 결과를 개선합니다.
이미지에서 텍스트 찾기
이미지 세트 내에서 텍스트 또는 정규식을 검색합니다.
이미지 텍스트 비교
대소문자 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교합니다.
사용하기 쉬운 OCR
C# OCR API를 사용하면 이미지를 텍스트로 변환하고, 검색 가능한 PDF를 만들고, 인식 결과를 문서에 저장하는 등 몇 줄의 C# 코드만 있으면 됩니다. OCR API를 .NET 솔루션에 통합하는 방법을 이해하려면 코드 샘플을 살펴보세요.
설치
몇 가지 제한 사항 을 적용하면 설치 후 바로 Aspose OCR for .NET을 사용할 수 있습니다. 임시 라이센스는 30일 동안 평가판의 모든 제한을 제거합니다. 이를 사용하여 완전한 기능을 갖춘 OCR 응용 프로그램 구축을 시작하고 나중에 .NET용 OCR 구매에 대한 최종 결정을 내리세요.
사진에서 텍스트 추출
사람들이 일반적으로 OCR(광학 문자 인식)을 생각할 때 가장 먼저 떠오르는 것은 주로 기본 캡처 장치인 스캐너입니다. 이러한 연관성은 역사적 이유가 있으며 여전히 많은 상황에서 널리 퍼져 있으며, 비교할 수 없는 품질로 실제 문서에서 인쇄된 텍스트를 캡처하기 위한 일관되고 통제된 환경을 제공합니다. 그러나 스캐너는 항상 가까이에 있지 않으며 작동하려면 고정된 워크스테이션이 필요한 특수 장비입니다. 다행스럽게도 현대 사회에서는 기존 스캐너에 대한 편리한 대안인 스마트폰 카메라를 제공합니다. 스마트폰 카메라 기술의 발전으로 보급형 스마트폰이라도 OCR 지원 문서를 캡처할 수 있는 충분한 품질을 제공할 수 있습니다. 내장 메모리를 사용하면 이동 중에도 대량의 문서, 신문, 책, 거리 표지판 및 기타 텍스트를 그 어느 때보다 쉽게 디지털화할 수 있습니다. 필요한 것은 사진을 기계가 읽을 수 있는 텍스트로 변환하는 데 적합한 기술뿐입니다.
저희 C# OCR 라이브러리는 기본적으로 모든 유형의 이미지를 인식하도록 특별히 설계되었으며 품질이 낮은 사진도 처리할 수 있도록 더욱 세부적으로 조정할 수 있습니다. 최신 스마트폰과 결합하면 대부분의 일상적인 스캔 및 텍스트 인식 작업을 위한 강력한 OCR 응용 프로그램을 만들 수 있습니다. 가장 진보된 이미지 처리 및 문서 구조 분석이 몇 줄의 코드로 수행되므로 복잡한 수학적 알고리즘, 신경망 및 기타 기술적 복잡성이 아닌 비즈니스에 집중할 수 있습니다.
사진 OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
스캔에서 검색 가능한 PDF 만들기
PDF는 특히 여러 페이지를 단일 파일로 결합할 수 있는 기능으로 인해 종이 문서를 스캔하는 데 가장 널리 사용되는 형식 중 하나입니다. 이 형식은 개인, 기업, 은행 및 정부 기관 간의 계약서, 송장, 법률 문서, 여권, ID 카드 및 기타 여러 문서를 교환하는 데 널리 사용됩니다. 그러나 스캔한 PDF는 기본적으로 이미지 모음입니다. 여기에는 기계가 읽을 수 있는 텍스트가 포함되어 있지 않으므로 사용자는 문서 내용을 검색, 복사 또는 조작할 수 없습니다.
Aspose .NET OCR은 스캔한 PDF를 완전히 검색 및 색인 가능한 문서로 변환하는 빠르고 쉽고 안정적인 방법을 제공합니다. 페이지 콘텐츠를 정확하게 인식하여 원본 이미지 위에 기계가 읽을 수 있는 텍스트 레이어로 변환합니다. 이 레이어는 선택, 복사, 텍스트 음성 변환 소프트웨어로 읽을 수 있으며 번역자, 요약자 및 기타 AI 기반 분석을 통해 자동으로 처리될 수도 있습니다. 도구.
PDF에 텍스트 오버레이 추가 - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
이미지에서 텍스트 검색
특히 대규모 조직의 디지털 아카이브는 방대한 스캔 및 사진 컬렉션으로 구성되는 경우가 많으며 그 중 상당수는 여러 페이지로 구성된 문서를 포함할 수 있습니다. 정보를 쉽게 검색하고 탐색하려면 이러한 아카이브를 효과적으로 관리하고 구성하는 것이 필수적입니다. 그러나 이미지에는 기계가 읽을 수 있는 텍스트가 포함되어 있지 않으므로 문서 내용을 검색하고 분석하는 것이 불가능합니다.
C# OCR 라이브러리를 사용하면 글꼴, 텍스트 크기, 스타일 및 기타 매개변수에 관계없이 이미지 속 텍스트를 쉽게 검색할 수 있습니다. 또한 라이브러리는 대소문자를 구분하지 않는 검색과 정규식을 지원하므로 다양한 애플리케이션과 산업에 매우 유용합니다. 이 기능은 텍스트에서 발견된 내용, 키워드 또는 패턴을 기반으로 문서를 분류하는 데 사용할 수 있습니다. 계약 및 계약 내의 특정 조건이나 조항을 검색합니다. 키워드나 그 안에 있는 콘텐츠를 기반으로 파일을 재구성합니다. 문서 내에서 개인 데이터를 찾아 식별함으로써 GDPR 준수를 더욱 쉽게 보장하고 중요한 정보를 보다 효과적으로 관리할 수 있습니다. 또한 이미지를 검색하면 자동화된 워크플로우를 생성하고 서명된 계약서 및 송장을 받을 때 다양한 비즈니스 프로세스를 간소화할 수 있습니다.
이미지에서 텍스트 검색 - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}