Aspose.OCR  for C++

Chuyển đổi hình ảnh và PDF sang văn bản trong C ++

Thêm tính năng nhận dạng ký tự quang học (OCR) vào các ứng dụng C ++ của bạn bằng một vài dòng mã.

  Download Free Trial
  
 

Aspose.OCR for C ++ mở rộng các ứng dụng của bạn với khả năng nhận dạng ký tự quang học trong 5 dòng mã. Kinh nghiệm của chúng tôi về mạng nơ-ron và học máy đã được dịch sang thư viện OCR với hiệu suất và độ chính xác vượt trội, hỗ trợ 26 ngôn ngữ dựa trên hệ thống chữ LatinhCyrillic cũng như tiếng Trung . OCR API có thể nhận dạng hình ảnh được quét, ảnh chụp trên điện thoại thông minh, ảnh chụp màn hình, vùng ảnh và các tệp PDF được quét và trả về kết quả ở các định dạng trao đổi dữ liệu và tài liệu phổ biến nhất. Nó hoàn toàn ngoại tuyến và không yêu cầu kết nối internet để hoạt động. API yêu cầu nỗ lực tối thiểu để bắt đầu và một đường cong học tập nông cạn để nắm vững. Tất cả các thao tác tiền xử lý, sửa sai lệch, loại bỏ nhiễu, phát hiện ngôn ngữ, đa luồng và các tác vụ phức tạp khác đều được thực hiện tự động, nhưng có thể được điều chỉnh để giải quyết các trường hợp khó.

Các tính năng API OCR C ++ nâng cao

Trích xuất văn bản từ hình ảnh và tạo các tệp PDF có thể tìm kiếm

Hỗ trợ bất kỳ hình ảnh nào bạn có thể lấy từ máy quét hoặc máy ảnh

Đọc các chữ viết Latinh và Kirin mở rộng

Nhận dạng hơn 6.000 ký tự Trung Quốc

Phát hiện và nhận dạng tất cả các kiểu chữ và định dạng phổ biến

Xử lý trước hình ảnh trước khi nhận dạng

Chỉ xử lý toàn bộ hình ảnh hoặc các khu vực đã chọn

Hỗ trợ hình ảnh xoay, lệch và nhiễu

Nhận dạng hàng loạt tất cả các hình ảnh trong một thư mục hoặc kho lưu trữ

Nhận dạng hình ảnh được cung cấp dưới dạng liên kết web

Tìm và tự động sửa các từ sai chính tả

Nhận kết quả nhận dạng dưới dạng JSON

Dễ sử dụng

Bạn vẫn nghĩ C ++ OCR là khó? Với thư viện của chúng tôi, bạn chỉ cần 5 dòng mã để nhận dạng hình ảnh và hiển thị kết quả. Hãy thử mã này và tự mình xem:

Hình ảnh thành văn bản trong 5 dòng - C ++

// Cung cấp đường dẫn hình ảnh
std::string image_path = "../Data/Source/sample.png";

// Chuẩn bị bộ đệm cho kết quả
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Làm điều kỳ diệu
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Hiển thị kết quả nhận dạng
std::wcout << buffer << L"\n";

26 ngôn ngữ nhận dạng

OCR API có thể nhận dạng một số lượng lớn các ngôn ngữ và tất cả các tập lệnh viết phổ biến, bao gồm cả các văn bản có ngôn ngữ hỗn hợp.

  • Bảng chữ cái Latinh mở rộng : tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Romania, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển.
  • Bảng chữ cái kirin : Belorussian, Bulgarian, Kazakhstan, Russian, Serbian, Ukraine.
  • Tiếng Trung : hơn 6.000 ký tự.

Bạn có thể để tính năng phát hiện ngôn ngữ cho thư viện hoặc tự xác định ngôn ngữ để tăng hiệu suất nhận dạng và độ tin cậy.

Xử lý hàng loạt

OCR API giải phóng bạn khỏi việc nhận ra từng hình ảnh một bằng cách cung cấp các phương pháp xử lý hàng loạt khác nhau cho phép bạn nhận ra nhiều hình ảnh trong một lần gọi:

  • Nhận dạng các tệp PDF và TIFF nhiều trang.
  • Nhận dạng tất cả các tệp trong một thư mục.
  • Nhận dạng tất cả các tệp trong kho lưu trữ.

Nhận dạng kho lưu trữ ZIP - C ++

// Cung cấp đường dẫn lưu trữ
std::string archive_path = "book.zip";

// Chuẩn bị bộ đệm cho kết quả
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Khởi tạo đối tượng RecognitionSettings với các giá trị mặc định
RecognitionSettings settings;

// Nhìn nhận
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Duy trì định dạng

Thư viện OCR đọc tất cả các kiểu chữ phổ biến như Arial, Times New Roman, Courier New, Tahoma, Calibri và hơn thế nữa ở các kiểu thông thường, đậm và nghiêng và giữ nguyên định dạng trong kết quả OCR một cách cẩn thận. Bạn cũng có thể chia kết quả nhận dạng thành các dòng và phát hiện các vùng văn bản trong một trang.

Nhận dạng ảnh

Việc áp dụng rộng rãi các ứng dụng OCR thường bị dừng lại bởi thực tế là máy quét không phổ biến đối với hầu hết người dùng. Thư viện OCR của chúng tôi có các bộ lọc tiền xử lý hình ảnh tích hợp mạnh mẽ có thể xử lý hình ảnh tối, xoay, lệch và nhiễu. Kết hợp với sự hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy ngay cả ảnh chụp trên điện thoại thông minh. Hầu hết việc xử lý trước và chỉnh sửa ảnh đều được thực hiện tự động nên bạn sẽ chỉ phải can thiệp trong những trường hợp khó.

Đặt góc tùy chỉnh để sửa lệch - C ++

// Ảnh gốc
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Chuẩn bị bộ đệm cho kết quả
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Điều chỉnh góc xiên
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Nhận dạng hình ảnh
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Kiểm tra chính tả

Mặc dù OCR tạo ra kết quả đáng tin cậy, nhưng lỗi in và bụi có thể khiến một số ký hiệu bị nhận dạng không chính xác. OCR API có công cụ kiểm tra chính tả tích hợp tự động thay thế các từ sai chính tả và giúp bạn không phải sửa các kết quả nhận dạng theo cách thủ công.

  

Support and Learning Resources

  
  

Aspose cũng cung cấp các API OCR riêng cho các ngôn ngữ lập trình phổ biến khác: