Thư viện C# OCR được hỗ trợ cho AI cho các ứng dụng .NET
Chuyển đổi hình ảnh thành văn bản trong C# OCR
Thêm giới thiệu >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Tại sao chọn Thư viện Aspose OCR?
Xây dựng các khả năng OCR mạnh mẽ vào các ứng dụng .NET của bạn trong vài giây. API OCR dễ sử dụng của chúng tôi cho phép bạn trích xuất văn bản từ hình ảnh và quét, tạo các tệp PDF có thể tìm kiếm và nhiều hơn nữa với mã C# tối thiểu. Lý tưởng cho các chức năng .NET Desktop, Web, Cloud và Serverless.
Kinh nghiệm OCR mà không chỉ trích xuất văn bản, nhưng hiểu và nâng cao nó với AI. Nhấp vào các mục dưới đây để tìm hiểu thêm về các tính năng và lợi ích của chúng tôi.

Ứng dụng OCR toàn cầu
C# OCR nhận ra tiếng Anh, Cyrillic, tiếng Ả Rập, tiếng Ba Tư, Trung Quốc, Nhật Bản, tiếng Hàn, tiếng Hindi, tiếng Tamil và ngôn ngữ hỗn hợp.
Đọc tất cả mọi thứ
Nhận văn bản từ bất kỳ tệp nào thu được thông qua máy quét hoặc máy ảnh và xử lý hình ảnh trực tiếp từ các liên kết web.
Kết quả đáng tin cậy
Đạt được độ chính xác nhận biết cao cho tất cả các hình ảnh, bao gồm cả những hình ảnh không tập trung, xoay vòng, bị biến dạng và ồn ào.
Nhận dạng hàng loạt
Nhận biết số lượng lớn tất cả các hình ảnh từ các thư mục và tài liệu lưu trữ; Đọc tài liệu PDF nhiều trang và hình ảnh TIFF.
Phát hiện bố trí
Xác định và phân loại các khối nội dung trong hình ảnh để đảm bảo đúng thứ tự của văn bản được trích xuất, bất kể bố cục.
AI Post xử lý bằng LLMS
Không chỉ OCR-giải pháp AI tất cả trong một của bạn để nhận dạng văn bản thông minh hơn, không có lỗi. Aspose.oc hiện đang tích hợp AI và LLM để chọn các mô hình giúp tăng cường đáng kể độ chính xác của OCR, các lỗi, khôi phục lại văn bản bị thiếu và cải thiện chất lượng nhận dạng tổng thể.
Mẫu mã trực tiếp
.NET OCR becomes a trivial and straightforward task with Aspose OCR API, even for new developers. Chỉ cần một vài dòng mã là đủ để trích xuất văn bản từ một hình ảnh và hiển thị nó trên màn hình. Nó thực sự đơn giản - hãy thử.
* Bằng cách tải lên các tệp của bạn hoặc sử dụng dịch vụ mà bạn đồng ý với Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Nhiều ví dụ hơn >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Nền tảng độc lập
Thư viện OCR đa nền tảng có thể hoạt động ở mọi nơi dưới .NET, .NET Core hoặc .NET Framework-cho dù trên máy cục bộ, trên máy chủ web hoặc trên đám mây.
Các định dạng tệp được hỗ trợ
Aspose.OCR for .NET có thể làm việc với bất kỳ tệp Bạn có thể nhận được từ máy quét hoặc máy ảnh. Kết quả nhận dạng có thể được lưu, nhập vào cơ sở dữ liệu hoặc được phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- BMP
- GIF
Lô OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
OCR do LLM cung cấp: Thế hệ OCR tiếp theo được điều khiển bởi các mô hình ngôn ngữ AI.
Độ chính xác của kết quả không dừng lại ở nhận dạng - mở khóa cấp độ chất lượng tiếp theo bằng cách tinh chỉnh văn bản bằng LLM bên ngoài.
- Tự động sửa lỗi chính tả và ngữ pháp trong văn bản được công nhận.
- Bình thường hóa sự không nhất quán và các vấn đề định dạng trên các lần quét nhiều trang.
- Điều chỉnh kết quả nhận dạng với từ vựng cụ thể theo chủ đề bằng cách sử dụng các mô hình hướng nhanh.
- Tích hợp bất kỳ đường ống LLM bên ngoài nào vào quy trình làm việc OCR của bạn chỉ bằng một vài dòng mã.
Thích hợp cho bất kỳ nội dung nào
Độ chính xác và độ tin cậy của nhận dạng văn bản trong C# phụ thuộc phần lớn vào chất lượng hình ảnh. .NET OCR cung cấp một bộ đầy đủ các tối ưu hóa hình ảnh tự động và thủ công, đảm bảo kết quả nhận dạng vượt trội.
Xử lý hình ảnh mạnh mẽ, phát hiện văn bản hoàn toàn có thể tùy chỉnh, xử lý hậu kỳ và sửa lỗi chính tả cho phép trích xuất văn bản từ bất kỳ quét hoặc ảnh nào có độ chính xác cao nhất.
Tối ưu hóa tài nguyên OCR
Thư viện Aspose ‘C# OCR cho phép cân bằng rất linh hoạt về tốc độ, chất lượng và sử dụng tài nguyên cho từng trường hợp sử dụng cụ thể:
- Chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
- Chỉ định số lượng luồng được phân bổ để nhận dạng hoặc cho phép thư viện .NET OCR của chúng tôi tự động mở rộng theo số lượng lõi của bộ xử lý.
- Giải phóng CPU bằng cách giảm tải các tính toán cho GPU.
140 ngôn ngữ nhận dạng
Thư viện C# OCR của chúng tôi là một giải pháp phổ quát để xử lý tài liệu, trích xuất dữ liệu và số hóa nội dung trên quy mô toàn cầu. Với sự hỗ trợ cho một loạt các kịch bản viết châu Âu, Trung Đông và Châu Á, nó được thích nghi tốt với bất kỳ quốc gia và doanh nghiệp nào.
Bạn có thể nhận ra các tài liệu được viết bằng các ngôn ngữ hỗn hợp, chẳng hạn như tiếng Trung/tiếng Anh, tiếng Ả Rập/tiếng Pháp hoặc cyrillic/tiếng Anh. Các ngôn ngữ sau được hỗ trợ:
- ** Latin mở rộng **: Tiếng Anh, Tây Ban Nha, Pháp, Indonesia, Bồ Đào Nha, Đức, Việt Nam, Thổ Nhĩ Kỳ, Ý, Ba Lan, và hơn 80 người khác;
- ** Cyrillic ** Bảng chữ cái: Nga, Ukraine, Kazakh, Bulgaria, bao gồm các văn bản cyrillic/tiếng Anh hỗn hợp;
- Ả Rập, tiếng Ba Tư, tiếng Urdu, bao gồm các văn bản trộn với tiếng Anh;
- Các ngôn ngữ Trung Quốc, tiếng Hàn, Nhật Bản, Devanagari và Dravidian, bao gồm tiếng Hindi, tiếng Tamil, Marathi và những người khác.
Tính năng và khả năng
C# OCR tự động trích xuất văn bản từ ảnh hoặc quét, loại bỏ sự cần thiết phải getyping tài liệu thủ công.
Ảnh OCR
Trích xuất văn bản từ ảnh điện thoại thông minh với độ chính xác cấp quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ lần quét thành một tài liệu có thể tìm kiếm đầy đủ và có thể lập chỉ mục.
Công nhận URL
Nhận ra một hình ảnh từ URL mà không tải xuống cục bộ.
Công nhận số lượng lớn
Đọc tất cả các hình ảnh từ các tài liệu, thư mục và tài liệu lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản trong tất cả các kiểu chữ và kiểu phổ biến.
Công nhận tinh chỉnh
Điều chỉnh mọi tham số OCR cho kết quả nhận dạng tốt nhất.
Checker chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp các hình ảnh.
So sánh văn bản hình ảnh
So sánh các văn bản trên hai hình ảnh, bất kể trường hợp và bố cục.
Sửa chữa hỗ trợ AI
Khắc phục các từ và ngữ pháp được công nhận sai bằng LLM dựa trên máy biến áp-không cần đào tạo tùy chỉnh.
Semantic Posticationing
Vượt xa hơn các ký tự: Tinh chỉnh đầu ra OCR ồn ào với LLM để cải thiện chất lượng nội dung và chuẩn hóa ngôn ngữ.
PLUP-IN PIPELINES
Kết nối các mô hình ngôn ngữ bên ngoài để sửa lỗi nhận dạng OCR và khôi phục văn bản không đầy đủ hoặc phân mảnh.
Dễ sử dụng OCR
Với API C# OCR của chúng tôi, bạn chỉ cần một vài dòng mã C# để chuyển đổi hình ảnh thành văn bản, tạo PDF có thể tìm kiếm, lưu kết quả nhận dạng vào tài liệu và nhiều hơn nữa. Khám phá các mẫu mã để hiểu cách tích hợp API OCR của chúng tôi vào các giải pháp .NET của bạn.
Cài đặt
Bạn có thể bắt đầu sử dụng OCR cho .NET ngay sau khi cài đặt với một số hạn chế . Giấy phép tạm thời loại bỏ tất cả các hạn chế của phiên bản dùng thử trong 30 ngày. Sử dụng nó để bắt đầu xây dựng một ứng dụng OCR đầy đủ chức năng và đưa ra quyết định cuối cùng để mua OCR cho .NET sau.
Trích xuất văn bản từ một bức ảnh
Khi mọi người thường nghĩ về OCR (nhận dạng ký tự quang học), liên kết đầu tiên thường có máy quét làm thiết bị chụp chính. Hiệp hội này có lý do lịch sử và vẫn còn phổ biến trong nhiều bối cảnh, cung cấp môi trường nhất quán và được kiểm soát để nắm bắt văn bản in từ các tài liệu vật lý với chất lượng chưa từng có. Tuy nhiên, một máy quét là thiết bị chuyên dụng không phải lúc nào cũng có sẵn và yêu cầu máy trạm đứng yên hoạt động. May mắn thay, thế giới hiện đại cung cấp một sự thay thế thuận tiện cho máy quét truyền thống - một camera điện thoại thông minh. Những tiến bộ trong công nghệ camera điện thoại thông minh đảm bảo rằng ngay cả một điện thoại thông minh cấp nhập cảnh cũng cung cấp đủ chất lượng để nắm bắt các tài liệu sẵn sàng OCR. Và bộ nhớ tích hợp giúp dễ dàng hơn bao giờ hết trong việc số hóa số lượng lớn tài liệu, báo chí, sách, biển báo đường phố và các văn bản khác khi đang di chuyển. Tất cả những gì bạn cần là công nghệ phù hợp để chuyển đổi những bức ảnh đó thành văn bản có thể đọc được bằng máy.
Thư viện C# OCR của chúng tôi được thiết kế đặc biệt để nhận ra tất cả các loại hình ảnh ngoài hộp và có thể được tinh chỉnh thêm để xử lý ngay cả các bức ảnh chất lượng thấp. Kết hợp với điện thoại thông minh hiện đại, nó cho phép bạn tạo các ứng dụng OCR mạnh mẽ cho hầu hết các tác vụ quét và nhận dạng văn bản hàng ngày. Phân tích cấu trúc tài liệu và xử lý hình ảnh tiên tiến nhất được thực hiện trong một vài dòng mã, cho phép bạn tập trung vào kinh doanh thay vì các thuật toán toán học phức tạp, mạng lưới thần kinh và các vấn đề kỹ thuật khác.
Ảnh OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Tạo tệp PDF có thể tìm kiếm được từ lần quét
PDF là một trong những định dạng phổ biến nhất để quét các tài liệu giấy, đặc biệt là do khả năng kết hợp nhiều trang thành một tệp. Định dạng này được sử dụng rộng rãi để trao đổi hợp đồng, hóa đơn, tài liệu pháp lý, hộ chiếu và thẻ ID và nhiều tài liệu khác giữa các cá nhân, doanh nghiệp, ngân hàng và cơ quan chính phủ. Tuy nhiên, bất kỳ PDF được quét nào về cơ bản là một tập hợp các hình ảnh. Nó không chứa văn bản có thể đọc được bằng máy, vì vậy người dùng không thể tìm kiếm, sao chép hoặc thao túng nội dung tài liệu.
aspose .NET OCR cung cấp cho bạn một cách nhanh chóng, dễ dàng và có độ tin cậy cao để chuyển đổi bất kỳ PDF được quét nào thành một tài liệu có thể tìm kiếm và có thể lập chỉ mục đầy đủ. Nó nhận ra chính xác nội dung trang, chuyển đổi nó thành một lớp văn bản có thể đọc được trên hình ảnh gốc có thể được chọn, sao chép, đọc bằng phần mềm văn bản thành giọng nói và thậm chí tự động được xử lý bởi các dịch giả, trình tóm tắt và các công cụ phân tích hỗ trợ AI khác.
Thêm lớp phủ văn bản vào PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Tìm kiếm văn bản trong hình ảnh
Lưu trữ kỹ thuật số, đặc biệt là trong các tổ chức lớn, thường bao gồm một bộ sưu tập lớn các bản quét và hình ảnh, nhiều trong số đó có thể chứa các tài liệu nhiều trang. Quản lý hiệu quả và tổ chức các tài liệu lưu trữ như vậy một cách hiệu quả là rất cần thiết để dễ dàng truy xuất và điều hướng thông tin. Tuy nhiên, hình ảnh không chứa văn bản có thể đọc được bằng máy, khiến không thể tìm kiếm và phân tích nội dung tài liệu.
Thư viện C# OCR cho phép bạn dễ dàng tìm kiếm văn bản trong hình ảnh, bất kể phông chữ, kích thước văn bản, kiểu và các tham số khác. Thư viện cũng hỗ trợ các tìm kiếm không nhạy cảm trường hợp và các biểu thức thường xuyên, cực kỳ hữu ích trong các ứng dụng và ngành công nghiệp khác nhau. Chức năng này có thể được sử dụng để phân loại các tài liệu dựa trên nội dung, từ khóa hoặc mẫu được tìm thấy trong văn bản; tìm kiếm các điều khoản hoặc điều khoản cụ thể trong các thỏa thuận và hợp đồng; Tổ chức lại các tệp dựa trên các từ khóa hoặc nội dung được tìm thấy trong chúng; Xác định vị trí và xác định dữ liệu cá nhân trong các tài liệu, giúp dễ dàng đảm bảo tuân thủ GDPR và quản lý thông tin nhạy cảm hiệu quả hơn. Tìm kiếm hình ảnh Withing cũng cho phép tạo các quy trình công việc tự động và hợp lý hóa các quy trình kinh doanh khác nhau khi nhận được các hợp đồng và hóa đơn đã ký.
Tìm kiếm văn bản trong hình ảnh - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}
AI Post xử lý với LLM
Bây giờ bạn có thể vượt ra ngoài sự công nhận thô và áp dụng logic điều khiển AI để cải thiện chất lượng văn bản của kết quả OCR. Các mô hình ngôn ngữ lớn (LLM) có thể sửa lỗi chính tả một cách thông minh, khôi phục ranh giới từ, áp dụng các quy tắc ngữ pháp và điều chỉnh văn bản dựa trên ngữ cảnh-điều mà các trình kiểm tra chính tả dựa trên cú pháp có thể làm.
Bước hậu xử lý này là lý tưởng cho các lần quét chất lượng thấp, ảnh có nhiễu nền hoặc tài liệu đa ngôn ngữ. Bạn có thể cắm vào bất kỳ đường ống LLM nào hỗ trợ đầu vào/đầu ra văn bản cơ bản hoặc sử dụng các công cụ hiệu chỉnh thông minh tích hợp của Aspose để có kết quả sẵn sàng sản xuất.
🧠ai Post xử lý với LLM - C#
// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();
// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
AllowAutoDownload = true,
DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};
// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);
// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());
// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);
// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);
// Release resources
aiEngine.Dispose();