HTML JPG OCR XML BMP
Aspose.OCR  cho C++
DOC

[Aspose.Imaging cho Java] ( https://products.aspose.com/imaging/java ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng DJVU và tạo tài liệu DJVU chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần lấy * Aspose.OCR * [Maven] ( https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging ) hoặc chỉ định cấu hình kho lưu trữ Aspose Maven và cài đặt nó trong dự án dựa trên Maven của bạn bằng cách thêm các cấu hình sau vào pom.xml. Đối với các ví dụ về Graddle, Ivy, Sbt, hãy xem [kho lưu trữ] của chúng tôi ( https://repository.aspose.com/ocr/) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Với C ++ OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh DJVU thành tài liệu DOC:

  • Tạo một thể hiện của lớp AsposeOcr
  • Gọi phương thức AsposeOCR.asposeocr_page ()
  • Chuyển đường dẫn tệp DJVU làm tham số
  • AsposeOCR.asposeocr_page trả về một Chuỗi hoặc tệp thuộc loại DOC

yêu cầu hệ thống

Trước khi chạy ví dụ, hãy đảm bảo rằng [Microsoft.ML.OnnxRuntime] ( https://www.nuget.org/packages/Microsoft.ML.OnnxRuntime/ ) 1.7.0 trở lên được thêm vào dự án. Nó sẽ được tự động cài đặt nếu bạn cài đặt Aspose.OCR qua NuGet Package Manager.

  • Giải pháp tương thích NET Standard 2.0+
  • Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • DJVU Là gì DJVU Định dạng tệp

    DjVu, được phát âm là “déjà vu”, là một định dạng tệp đồ họa dành cho các tài liệu và sách được quét, đặc biệt là những tài liệu có chứa sự kết hợp của văn bản, bản vẽ, hình ảnh và ảnh chụp. Nó được phát triển bởi AT&T Labs. Nó sử dụng nhiều kỹ thuật như tách lớp hình ảnh của văn bản và hình ảnh nền, tải liên tục, mã hóa số học và nén mất dữ liệu cho hình ảnh bitonal. Vì tệp DJVU có thể chứa hình ảnh, ảnh, văn bản và bản vẽ màu được nén nhưng chất lượng cao và có thể được lưu trong ít dung lượng hơn, do đó, nó được sử dụng trên web dưới dạng sách điện tử, sách hướng dẫn, báo chí, tài liệu cổ, v.v.

    Đọc thêm

    DOC Là gì DOC Định dạng tệp

    Các tệp có phần mở rộng .doc đại diện cho các tài liệu được tạo bởi Microsoft Word hoặc các tài liệu xử lý văn bản khác ở định dạng tệp nhị phân. Phần mở rộng ban đầu được sử dụng cho tài liệu văn bản thuần túy trên một số hệ điều hành khác nhau. Nó có thể chứa một số loại dữ liệu khác nhau như hình ảnh, được định dạng cũng như văn bản thuần túy, đồ thị, biểu đồ, đối tượng nhúng, liên kết, trang, định dạng trang, cài đặt in và nhiều thứ khác. Định dạng này phổ biến cho tất cả các loại tài liệu do có nhiều tùy chọn mà nó cung cấp cho người dùng để viết hướng dẫn sử dụng, đề xuất, thông số kỹ thuật, sơ yếu lý lịch, bài báo hoặc bất kỳ tài liệu nào tương tự. Phiên bản cập nhật của DOC là DOCX dựa trên Office OpenXML có thông số kỹ thuật được cung cấp công khai.

    Đọc thêm