HTML JPG OCR XML BMP
Aspose.OCR  cho C++
Searchable PDF

[Aspose.Imaging cho Java] ( https://products.aspose.com/imaging/java ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng JPEG và tạo tài liệu JPEG chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần lấy * Aspose.OCR * [Maven] ( https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging ) hoặc chỉ định cấu hình kho lưu trữ Aspose Maven và cài đặt nó trong dự án dựa trên Maven của bạn bằng cách thêm các cấu hình sau vào pom.xml. Đối với các ví dụ về Graddle, Ivy, Sbt, hãy xem [kho lưu trữ] của chúng tôi ( https://repository.aspose.com/ocr/) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Với C ++ OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh JPEG thành tài liệu Searchable PDF:

  • Tạo một thể hiện của lớp AsposeOcr
  • Gọi phương thức AsposeOCR.asposeocr_page ()
  • Chuyển đường dẫn tệp JPEG làm tham số
  • AsposeOCR.asposeocr_page trả về một Chuỗi hoặc tệp thuộc loại Searchable PDF

yêu cầu hệ thống

Trước khi chạy ví dụ, hãy đảm bảo rằng [Microsoft.ML.OnnxRuntime] ( https://www.nuget.org/packages/Microsoft.ML.OnnxRuntime/ ) 1.7.0 trở lên được thêm vào dự án. Nó sẽ được tự động cài đặt nếu bạn cài đặt Aspose.OCR qua NuGet Package Manager.

  • Giải pháp tương thích NET Standard 2.0+
  • Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JPEG Là gì JPEG Định dạng tệp

    JPEG là một loại định dạng hình ảnh được lưu bằng phương pháp nén mất dữ liệu. Hình ảnh đầu ra, là kết quả của quá trình nén, là sự cân bằng giữa kích thước lưu trữ và chất lượng hình ảnh. Người dùng có thể điều chỉnh mức độ nén để đạt được mức chất lượng mong muốn đồng thời giảm dung lượng lưu trữ. Chất lượng hình ảnh bị ảnh hưởng đáng kể nếu áp dụng nén 10: 1 cho hình ảnh. Giá trị nén càng cao thì chất lượng ảnh càng giảm.

    Đọc thêm

    Searchable PDF Là gì Searchable PDF Định dạng tệp

    Các tệp PDF có thể tìm kiếm giữ lại hình ảnh được quét gốc để xem, cũng như văn bản OCR trong một lớp ẩn có thể được sử dụng để tìm kiếm toàn văn trong tài liệu hoặc đánh dấu văn bản cho các thao tác sao chép và dán. Chuyển đổi OCR đầy đủ sang PDF, không bao gồm hình ảnh gốc, sẽ không bao giờ giữ lại 100% định dạng ban đầu, đặc biệt nếu tài liệu có nhiều hình ảnh hoặc bố cục phức tạp.

    Đọc thêm

    TXT (Tệp tài liệu văn bản)
    Text (Tệp tài liệu văn bản)
    DOC (Tài liệu được tạo bởi Microsoft Word)
    DOCX (Tài liệu Microsoft Word)
    XLS (Định dạng tệp nhị phân Microsoft Excel)
    XLSX (Tài liệu Microsoft Excel)
    PDF (Định dạng tài liệu di động (PDF))
    Searchable PDF (Đồ họa mạng di động có thể tìm kiếm)