.NET 애플리케이션을위한 AI 전원 C# OCR 라이브러리
C# OCR에서 이미지를 텍스트로 변환하십시오
더 많은 쇼케이스 >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
OCR 라이브러리를 선택하는 이유는 무엇입니까?
몇 초 만에 .NET 앱에 강력한 OCR 기능을 구축하십시오. 사용하기 쉬운 OCR API를 사용하면 이미지 및 스캔에서 텍스트를 추출하고 검색 가능한 PDF를 최소화하여 최소한 C# 코드를 만들 수 있습니다. .NET 데스크탑, 웹, 클라우드 및 서버리스 기능에 이상적입니다.
텍스트를 추출하는 것이 아니라 AI로 텍스트를 이해하고 향상시키는 OCR을 경험하십시오. 우리의 기능과 이점에 대해 자세히 알아 보려면 아래 항목을 클릭하십시오.

글로벌 OCR 응용 프로그램
C# OCR은 영어, 키릴, 아랍어, 페르시아어, 중국어, 일본어, 한국, 힌디어, 타밀어 및 혼합 문자를 인정합니다.
모든 것을 읽으십시오
스캐너 나 카메라를 통해 얻은 모든 파일에서 텍스트를 가져 와서 웹 링크에서 직접 이미지를 처리하십시오.
신뢰할 수있는 결과
초점 외, 회전, 왜곡 및 시끄러운 이미지를 포함하여 모든 이미지에 대해 높은 인식 정확도를 달성하십시오.
배치 인식
폴더 및 아카이브에서 모든 이미지를 대량 인식; 다중 페이지 PDF 문서 및 TIFF 이미지를 읽으십시오.
레이아웃 감지
레이아웃에 관계없이 추출 된 텍스트의 올바른 순서를 보장하기 위해 이미지의 컨텐츠 블록을 식별하고 분류합니다.
LLM을 사용한 AI 후 처리
OCR뿐만 아니라 더 똑똑하고 오류가없는 텍스트 인식을위한 올인원 AI 솔루션. Aspose.ocr은 이제 AI 및 LLM을 통합하여 OCR 정확도를 크게 향상시키는 모델을 선택하여 오류를 고정하고, 누락 된 텍스트를 복원하며, 전반적인 인식 품질을 향상시킵니다.
라이브 코드 샘플
.NET OCR은 새로운 개발자에게도 OCR API를 사용하여 사소하고 간단한 작업이됩니다. 몇 줄의 코드만으로는 이미지에서 텍스트를 추출하여 화면에 표시하기에 충분합니다. 정말 간단합니다. 시도해보십시오.
* 파일을 업로드하거나 서비스를 사용하여 귀하는 동의합니다. 이용 약관 그리고 개인 정보 보호 정책.
이미지를 텍스트로 변환합니다
더 많은 예 >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
플랫폼 독립성
Cross-Platform OCR 라이브러리는 .NET, .NET Core 또는 .NET Framework에서 로컬 컴퓨터, 웹 서버 또는 클라우드에서 [https://docs.aspose.com/ocroc/net/system-requirements/)를 작동시킬 수 있습니다.
지원되는 파일 형식
Aspose.OCR for .NET [파일]과 함께 작동 할 수 있습니다.( https://docs.aspose.com/ocr/net/supported-file-formats/ ) 스캐너 나 카메라에서 얻을 수 있습니다. 인식 결과를 저장, 데이터베이스로 가져 오거나 실시간으로 분석 할 수 있습니다.
이미지
- JPEG
- PNG
- TIFF
- BMP
- GIF
배치 OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
인식 결과
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
LLM 구동 OCR : AI 언어 모델에 의해 구동되는 차세대 OCR.
결과 정확도는 인식시 중지되지 않습니다. 외부 LLM을 사용하여 텍스트를 정제하여 다음 수준의 품질을 잠금 해제하십시오.
- 인식 된 텍스트에서 철자와 문법을 자동으로 수정합니다.
- 다중 페이지 스캔에서 불일치 및 서식 문제를 정상화하십시오.
- 프롬프트 중심 모델을 사용하여 주제 별 어휘에 인식 결과를 적응시킵니다.
- 외부 LLM 파이프 라인을 몇 줄의 코드로 OCR 워크 플로우에 통합하십시오.
모든 콘텐츠에 적합합니다
C#에서 텍스트 인식의 정확성과 신뢰성은 이미지 품질에 따라 다릅니다. .NET OCR은 자동화 된 수동 및 수동 이미지 최적화 세트를 제공하여 우수한 인식 결과를 보장합니다.
강력한 이미지 처리, 완전히 사용자 정의 가능한 텍스트 감지, 후 처리 및 자동 철자 수정은 가장 높은 정확도로 스캔 또는 사진에서 텍스트 추출을 가능하게합니다.
OCR 리소스 최적화
‘C# OCR Library는 각 특정 사용 사례에 대한 인식 속도, 품질 및 자원 활용의 융통성 균형을 높일 수 있습니다.
- 철저한 인식과 빠른 인식을 선택하십시오.
- 인식을 위해 할당 된 스레드 수를 지정하거나 .NET OCR 라이브러리가 프로세서 코어 수로 자동 스케일링되도록 허용하십시오.
- 계산을 GPU에 오프로드하여 CPU를 탈퇴하십시오.
140+ 인식 언어
우리의 C# OCR 라이브러리는 글로벌 규모의 문서 처리, 데이터 추출 및 컨텐츠 디지털화를위한 보편적 인 솔루션입니다. 다양한 유럽, 중동 및 아시아 작문 대본을 지원함으로써 모든 국가와 비즈니스에 적합합니다.
중국어/영어, 아랍어/프랑스어 또는 키릴/영어와 같은 혼합 언어로 작성된 문서를 인식 할 수 있습니다. 다음 언어가 지원됩니다.
- ** 확장 된 라틴어 ** : 영어, 스페인어, 프랑스어, 인도네시아, 포르투갈어, 독일어, 베트남어, 터키, 이탈리아어, 폴란드어 및 80+ 더;
- ** 키릴 릭 ** 알파벳 : 러시아어, 우크라이나, 카자흐, 불가리아어, 혼합 키릴/영어 텍스트를 포함한 불가리아;
- 영어와 혼합 된 텍스트를 포함한 아랍어, 페르시아어, 우르두어;
- 힌디어, 타밀어, 마라 티어 등을 포함한 중국어, 한국, 일본, 데바나 가리 및 드라비아 언어.
특징 및 기능
C# OCR은 사진이나 스캔에서 텍스트를 자동으로 추출하여 문서의 수동 실적이 필요하지 않습니다.
사진 OCR
스캔 레벨 정확도로 스마트 폰 사진에서 텍스트를 추출하십시오.
검색 가능한 PDF
모든 스캔을 완전히 검색 가능하고 색인 가능한 문서로 변환하십시오.
URL 인식
로컬로 다운로드하지 않고 URL에서 이미지를 인식하십시오.
대량 인식
다중 페이지 문서, 폴더 및 아카이브의 모든 이미지를 읽으십시오.
모든 글꼴과 스타일
모든 인기있는 서체와 스타일에서 텍스트를 식별하고 인식하십시오.
미세 조정 인식
최상의 인식 결과를 위해 모든 OCR 매개 변수를 조정하십시오.
맞춤법 검사기
잘못된 철자를 자동으로 수정하여 결과를 향상시킵니다.
이미지에서 텍스트를 찾으십시오
이미지 세트 내에서 텍스트 또는 정규 표현식을 검색하십시오.
이미지 텍스트를 비교하십시오
케이스 및 레이아웃에 관계없이 두 이미지의 텍스트를 비교하십시오.
AI 기반 보정
변압기 기반 LLM을 사용하여 잘못 인식 된 단어와 문법을 수정하십시오. 사용자 정의 교육이 필요하지 않습니다.
시맨틱 후 처리
캐릭터를 넘어서십시오 : LLM으로 시끄러운 OCR 출력을 개선하여 컨텐츠 품질 및 언어 정규화 향상을 위해.
플러그인 LLM 파이프 라인
외부 언어 모델을 연결하여 OCR 인식 실수를 수정하고 불완전하거나 조각난 텍스트를 복원하십시오.
사용하기 쉬운 OCR
C# OCR API를 사용하려면 이미지를 텍스트로 변환하고 검색 가능한 PDF를 작성하고 인식 결과를 문서화하여 저장하는 등 몇 줄의 C# 코드 만 있으면됩니다. OCR API를 .NET 솔루션에 통합하는 방법을 이해하려면 코드 샘플을 탐색하십시오.
설치
[https://docs.aspose.com/ocroc/bnet/licensing/)와 함께 설치 직후 .NET에 OCR을 사용할 수 있습니다. 임시 라이센스는 30 일 동안 시험판의 모든 제한을 제거합니다. 이를 사용하여 완전히 기능적인 OCR 응용 프로그램을 구축하고 나중에 .NET 용 OCR을 구매하기로 결정하십시오.
사진에서 텍스트를 추출하십시오
사람들이 일반적으로 OCR (광학 문자 인식)을 생각할 때, 첫 번째 연관은 종종 스캐너를 기본 캡처 장치로 사용합니다. 이 협회는 역사적 이유가 있으며 여전히 많은 맥락에서 널리 퍼져 있으며, 비교할 수없는 품질을 가진 물리적 문서에서 인쇄 된 텍스트를 캡처하기위한 일관되고 통제 된 환경을 제공합니다. 그러나 스캐너는 항상 손에 들어 가지 않고 작동하기 위해 고정 된 워크 스테이션이 필요한 특수 장비입니다. 다행히도 현대 세계는 스마트 폰 카메라 인 전통적인 스캐너에 대한 편리한 대안을 제공합니다. 스마트 폰 카메라 기술의 발전으로 엔트리 레벨 스마트 폰조차도 OCR 지원 문서를 캡처하기에 충분한 품질을 제공 할 수 있습니다. 그리고 내장 메모리를 사용하면 이동 중에 대량의 문서, 신문, 서적, 거리 표시 및 기타 텍스트를 디지털화 할 수 있습니다. 필요한 것은 해당 사진을 기계 읽을 수있는 텍스트로 변환하는 올바른 기술 만 있으면됩니다.
우리의 C# OCR 라이브러리는 모든 유형의 이미지를 상자 외부에서 인식하도록 특별히 설계되었으며 저품질 사진조차도 더 미세 조정할 수 있습니다. 최신 스마트 폰과 결합하여 대부분의 일상적인 스캔 및 텍스트 인식 작업을위한 강력한 OCR 애플리케이션을 만들 수 있습니다. 가장 진보 된 이미지 처리 및 문서 구조 분석은 몇 줄의 코드로 수행되므로 복잡한 수학적 알고리즘, 신경망 및 기타 기술적 복잡성보다는 비즈니스에 집중할 수 있습니다.
사진 OCR -C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
스캔에서 검색 가능한 PDF를 만듭니다
PDF는 종이 문서를 스캔하는 데 가장 인기있는 형식 중 하나입니다. 특히 여러 페이지를 단일 파일로 결합 할 수 있기 때문입니다. 이 형식은 계약, 송장, 법률 문서, 여권 및 ID 카드의 교환 및 개인, 기업, 은행 및 정부 기관 간의 기타 여러 문서의 교환에 널리 사용됩니다. 그러나 스캔 한 PDF는 본질적으로 이미지 모음입니다. 기계로 읽을 수있는 텍스트가 포함되어 있지 않으므로 사용자는 문서 컨텐츠를 검색, 복사 또는 조작 할 수 없습니다. .NET OCR은 .NET OCR을 사용하면 스캔 한 PDF를 완전히 검색 할 수 있고 색인이 가능한 문서로 변환하는 빠르고 쉽고 신뢰할 수있는 방법을 제공합니다. 페이지 컨텐츠를 정확하게 인식하고, 선택, 복사, 텍스트 음성 소프트웨어에 의해 읽거나, 번역기, 요약자 및 기타 AI 구동 분석 도구에 의해 자동으로 처리 될 수있는 원본 이미지를 통해 기계 읽을 수있는 텍스트 계층으로 변환합니다.
PDF에 텍스트 오버레이 추가 -C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
이미지에서 텍스트를 검색하십시오
디지털 아카이브, 특히 대규모 조직의 디지털 아카이브는 종종 방대한 스캔 및 사진 모음으로 구성되며, 그 중 다중 페이지 문서가 포함될 수 있습니다. 이러한 아카이브의 효율적인 관리 및 구성은 쉽게 정보 검색 및 탐색을 위해 필수적입니다. 그러나 이미지에는 기계 읽을 수있는 텍스트가 포함되어 있지 않으므로 문서 내용을 검색하고 분석 할 수 없습니다.
C# OCR 라이브러리를 사용하면 글꼴, 텍스트 크기, 스타일 및 기타 매개 변수에 관계없이 이미지에서 텍스트를 쉽게 검색 할 수 있습니다. 이 라이브러리는 또한 사례 감수성 검색 및 정규식을 지원하며 다양한 응용 분야 및 산업에서 매우 유용합니다. 이 기능은 텍스트에있는 내용, 키워드 또는 패턴을 기반으로 문서를 분류하는 데 사용될 수 있습니다. 계약 및 계약 내에서 특정 약관 또는 조항을 검색; 키워드 또는 그 안에 발견 된 컨텐츠를 기반으로 파일을 재구성합니다. 문서 내에서 개인 데이터를 찾고 식별하여 GDPR 준수를보다 쉽게 준수하고 민감한 정보를보다 효과적으로 관리 할 수 있습니다. 이미지를 검색하면 자동화 된 워크 플로를 생성하고 서명 된 계약 및 송장을 받으면 다양한 비즈니스 프로세스를 간소화 할 수 있습니다.
이미지에서 텍스트 검색 -C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}
LLM을 사용한 AI 후 처리
이제 원시 인식을 넘어 AI 중심 논리를 적용하여 OCR 결과의 텍스트 품질을 향상시킬 수 있습니다. 대형 언어 모델 (LLMS)은 철자 오류를 지능적으로 수정하고, 단어 경계를 복원하고, 문법 규칙을 적용하며, 컨텍스트에 따라 텍스트를 조정할 수 있습니다.
이 후 처리 단계는 저품질 스캔, 배경 소음이있는 사진 또는 다국어 문서에 이상적입니다. 기본 텍스트 입력/출력을 지원하는 LLM 파이프 라인을 연결하거나 Aspose의 내장 스마트 수정 도구를 사용하여 생산 준비 결과를 얻을 수 있습니다.
LLM을 사용한 후 처리 - C#
// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();
// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
AllowAutoDownload = true,
DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};
// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);
// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());
// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);
// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);
// Release resources
aiEngine.Dispose();