Chuyển đổi hình ảnh và PDF thành văn bản trong .NET

Thêm nhận dạng ký tự quang học (OCR) vào các ứng dụng .NET của bạn bằng một vài dòng mã.

Aspose.OCR cho .NET là một API mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để nhận dạng ký tự quang học. Với nó, bạn có thể thêm chức năng OCR vào các ứng dụng .NET của mình trong ít hơn 5 dòng mã mà không cần lo lắng về toán học phức tạp, mạng nơ-ron và các chi tiết kỹ thuật khác. Kinh nghiệm của chúng tôi về công nghệ học máy và nhiều năm phát triển đã tạo ra một công cụ OCR với tốc độ và độ chính xác vượt trội hỗ trợ 26 ngôn ngữ dựa trên hệ thống chữ viết Latinh và Cyrillic cũng như tiếng Trung . OCR API có thể nhận dạng hình ảnh được quét, ảnh chụp trên điện thoại thông minh, ảnh chụp màn hình, vùng ảnh và các tệp PDF được quét và trả về kết quả ở các định dạng trao đổi dữ liệu và tài liệu phổ biến nhất. Các bộ lọc tiền xử lý khác nhau cho phép bạn nhận ra các hình ảnh xoay, lệch và nhiễu. Hiệu suất nhận dạng và tải hệ thống có thể được cải thiện hơn nữa bằng cách chuyển các tác vụ tính toán sử dụng nhiều tài nguyên sang GPU .

Sơ lược

Tóm tắt ngắn gọn về khả năng nhận dạng ký tự quang học.

Phông chữ được hỗ trợ

Arial
Times New Roman
Courier New
Tahoma
Calibri
Verdana

Các kiểu phông chữ được hỗ trợ

Phông chữ thông thường
Kiểu chữ in đậm
Phông chữ nghiêng

Các ngôn ngữ được hỗ trợ

Ngôn ngữ tiếng anh
tiếng Trung Quốc
tiếng Đức
tiếng Pháp
tiếng Ý
tiếng Tây Ban Nha
Ngôn ngữ Nga
Tiếng Séc
Tiếng ba lan
Tiếng Ukraina
Ngôn ngữ Hà Lan
Tiếng Estonia
và hơn 10 nữa

Aspose.OCR

Nền tảng độc lập

Aspose.OCR cho .NET hỗ trợ .NET Standard 2.0.

Triển khai .NET

.NET 6.0
.NET 5.0
.NET Core
.NET Framework
Mono
Xamarin

Các ứng dụng

Ứng dụng máy tính để bàn
Dịch vụ Windows
ASP.NET MVC
ASP.NET Web API
Dịch vụ web
Dịch vụ điện toán đám mây

Aspose.OCR

Các định dạng tệp được hỗ trợ

Chuyển đổi [bất kỳ tệp nào] ( https://docs.aspose.com/ocr/net/supported-file-formats/ ) bạn nhận được từ máy quét hoặc máy ảnh sang các định dạng tài liệu và trao đổi dữ liệu phổ biến nhất.

Tệp nguồn

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

Kết quả ghi nhận

PDF có thể tìm kiếm
Microsoft Word
Microsoft Excel
Văn bản thô
JSON
XML

Aspose.OCR

Các tính năng và khả năng của Aspose.OCR cho .NET

Chuyển đổi hình ảnh và PDF thành văn bản

Hỗ trợ tất cả các định dạng hình ảnh mà bạn có thể lấy từ máy quét hoặc máy ảnh

Đọc các ngôn ngữ dựa trên tiếng Latinh và Cyrillic

Nhận dạng hơn 6.000 ký tự Trung Quốc

Phát hiện và nhận dạng tất cả các kiểu chữ phổ biến

Giữ gìn cẩn thận các kiểu và định dạng phông chữ

Chỉ xử lý toàn bộ hình ảnh hoặc các khu vực đã chọn

Hỗ trợ hình ảnh xoay, lệch và nhiễu

Nhận dạng hàng loạt tất cả các hình ảnh trong một thư mục hoặc kho lưu trữ

Nhận dạng hình ảnh được cung cấp dưới dạng liên kết web

Tìm và tự động sửa các từ sai chính tả

Hoàn toàn tương thích với các sản phẩm Aspose khác

Dễ dàng để cài đặt

Aspose.OCR cho .NET được phân phối dưới dạng gói NuGet nhẹ hoặc dưới dạng tệp có thể tải xuống với phụ thuộc tối thiểu. Chỉ cần cài đặt nó vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng bất kỳ ngôn ngữ được hỗ trợ nào và lưu kết quả nhận dạng ở bất kỳ định dạng nào được hỗ trợ.

Yêu cầu giấy phép tạm thời để bắt đầu xây dựng một ứng dụng OCR đầy đủ chức năng mà không có bất kỳ giới hạn và hạn chế nào.

Dễ sử dụng

Bạn cần ba dòng mã để nhận dạng hình ảnh và hiển thị kết quả. Vâng, nó thực sự đơn giản!

Hình ảnh thành văn bản trong 3 dòng - C #

// Khởi tạo công cụ OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Nhận dạng hình ảnh thành văn bản
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Hiển thị kết quả nhận dạng
Console.WriteLine(result);

Nền tảng chéo

Thư viện hỗ trợ đầy đủ .NET Standard 2.0. Nó có nghĩa là các ứng dụng có thể chạy trên mọi nền tảng: máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.

26 ngôn ngữ nhận dạng

OCR API có thể nhận dạng một số lượng lớn các ngôn ngữ và tất cả các tập lệnh viết phổ biến, bao gồm cả các văn bản có ngôn ngữ hỗn hợp.

Bảng chữ cái Latinh mở rộng : tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Romania, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển.
Bảng chữ cái kirin : Belorussian, Bulgarian, Kazakhstan, Russian, Serbian, Ukraine.
Tiếng Trung : hơn 6.000 ký tự.

Bạn có thể để tính năng phát hiện ngôn ngữ cho thư viện hoặc tự xác định ngôn ngữ để tăng hiệu suất nhận dạng và độ tin cậy.

Nhận dạng ảnh

Rào cản lớn nhất đối với các ứng dụng OCR là máy quét không phổ biến cho người dùng cuối. API có các bộ lọc tiền xử lý hình ảnh tích hợp mạnh mẽ có thể xử lý các hình ảnh xoay, lệch và nhiễu. Kết hợp với sự hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy ngay cả ảnh chụp trên điện thoại thông minh. Hầu hết việc xử lý trước và chỉnh sửa ảnh đều được thực hiện tự động nên bạn sẽ chỉ phải can thiệp trong những trường hợp khó.

Áp dụng các hiệu chỉnh hình ảnh tự động - C #

// Khởi tạo công cụ OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Bật tính toán độ nghiêng và độ tương phản tự động
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Nhận dạng hình ảnh
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Bộ chuyển đổi đa năng

API có thể đọc theo nghĩa đen bất kỳ hình ảnh nào bạn có thể nhận được từ máy quét, máy ảnh hoặc điện thoại thông minh: tài liệu PDF, hình ảnh JPEG, PNG, TIFF, GIF, BMP và thậm chí cả tệp DjVu. Các tài liệu PDF nhiều trang, hình ảnh TIFF và DjVu được hỗ trợ đầy đủ. Bạn cũng có thể cung cấp một hình ảnh từ web thông qua một URL.

Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tài liệu phổ biến nhất: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.

Nhận dạng PDF và lưu kết quả sang JSON - C #

// Khởi tạo công cụ OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Nhận dạng tất cả các trang từ PDF được quét
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Xuất từng trang dưới dạng JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Tối ưu hóa tài nguyên

Nhận dạng ký tự quang học là một quá trình sử dụng nhiều tài nguyên. API cung cấp các cách rất linh hoạt để đạt được sự cân bằng trong bộ ba chất lượng thời gian - giá cả cổ điển:

Lựa chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
Chỉ định số luồng được phân bổ để nhận dạng hoặc cho phép thư viện tự động chia tỷ lệ theo số lõi bộ xử lý.
Giải phóng CPU bằng cách giảm tải các tính toán xuống GPU.

Nhận dạng nhanh - C #

// Khởi tạo công cụ OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Nhận dạng hình ảnh ở chế độ nhanh nhất
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Kiểm tra chính tả

Mặc dù OCR tạo ra kết quả đáng tin cậy, nhưng lỗi in và bụi có thể khiến một số ký hiệu bị nhận dạng không chính xác. OCR API có công cụ kiểm tra chính tả tích hợp tự động thay thế các từ sai chính tả và giúp bạn không phải sửa các kết quả nhận dạng theo cách thủ công.

Kết quả nhận dạng kiểm tra chính tả - C #

// Khởi tạo công cụ OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Bật độ tương phản tự động
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Nhận dạng hình ảnh
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Sửa các từ sai chính tả
string text =  result.GetSpellCheckCorrectedText();

Xử lý hàng loạt

OCR API giải phóng bạn khỏi việc nhận ra từng hình ảnh một bằng cách cung cấp các phương pháp xử lý hàng loạt khác nhau cho phép bạn nhận ra nhiều hình ảnh trong một lần gọi:

Nhận dạng các tệp PDF, TIFF và DjVu nhiều trang.
Nhận dạng tất cả các tệp trong một thư mục.
Nhận dạng tất cả các tệp trong kho lưu trữ.
Nhận dạng tất cả các tệp từ một danh sách.

Học bằng ví dụ

Aspose.OCR cho .NET đi kèm với một số ví dụ được viết bằng C # cho phép bạn nhanh chóng làm quen với các chức năng và khả năng của nó và cung cấp cho bạn ý tưởng về việc tạo ra các giải pháp cho nhu cầu kinh doanh của bạn.

Support and Learning Resources

Tại sao sử dụng Aspose.OCR cho .NET?
Danh sách khách hàng
Câu chuyện thành công

Download Free Trial Pricing Information

Aspose cũng cung cấp các API OCR riêng cho các ngôn ngữ lập trình phổ biến khác:

Chuyển đổi hình ảnh và PDF thành văn bản trong .NET

Thêm nhận dạng ký tự quang học (OCR) vào các ứng dụng .NET của bạn bằng một vài dòng mã.

Aspose.OCR for .NET

Overview

Sơ lược

Nền tảng độc lập

Các định dạng tệp được hỗ trợ

Các tính năng và khả năng của Aspose.OCR cho .NET

Dễ dàng để cài đặt

Dễ sử dụng

Hình ảnh thành văn bản trong 3 dòng - C #

Nền tảng chéo

26 ngôn ngữ nhận dạng

Nhận dạng ảnh

Áp dụng các hiệu chỉnh hình ảnh tự động - C #

Bộ chuyển đổi đa năng

Nhận dạng PDF và lưu kết quả sang JSON - C #

Tối ưu hóa tài nguyên

Nhận dạng nhanh - C #

Kiểm tra chính tả

Kết quả nhận dạng kiểm tra chính tả - C #

Xử lý hàng loạt

Học bằng ví dụ

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++