HTML JPG OCR XML BMP
Aspose.OCR  cho .NET
Searchable PDF

Chuyển đổi JPEG2000 thành Searchable PDF trong C#

Thực hiện nhận dạng ký tự quang học trên tài liệu JPEG2000 và lưu văn bản dưới dạng tài liệu JPEG2000 bằng thư viện Aspose.OCR fro .NET.

Cách chuyển đổi JPEG2000 thành Searchable PDF bằng C#

Aspose.OCR cho .NET là một thư viện mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để chuyển đổi hình ảnh JPEG2000 sang tài liệu Searchable PDF. Hỗ trợ 26 ngôn ngữ dựa trên tiếng Latinh, Cyrillic và Trung Quốc, công cụ nhận dạng ký tự quang học hiện đại của nó cung cấp tốc độ nhận dạng và độ chính xác vượt trội, đồng thời cách ly bạn khỏi các công thức, mạng nơ-ron và các chi tiết kỹ thuật phức tạp khác. Nó cho phép bạn thêm chức năng OCR vào các ứng dụng .NET của mình trong vòng chưa đầy 10 dòng mã.

[Aspose.OCR cho .NET] ( https://products.aspose.com/ocr/net ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng JPEG2000 và tạo tài liệu JPEG2000 chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần cài đặt * Aspose.OCR * [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) gói trong dự án của bạn bằng lệnh sau:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Các bước chuyển đổi JPEG2000 thành Searchable PDF

Với .NET OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh JPEG2000 thành tài liệu Searchable PDF:

  • Tạo một thể hiện của lớp AsposeOcr
  • Gọi phương thức AsposeOCR.RecognizeImage
  • Chuyển đường dẫn tệp JPEG2000 làm tham số
  • AsposeOCR.RecognizeImage trả về một Chuỗi hoặc tệp thuộc loại Searchable PDF

yêu cầu hệ thống

Trước khi chạy ví dụ, hãy đảm bảo rằng API .NET tương thích với đặc tả NET Standard 2.0 được cài đặt trên hệ thống của bạn và tất cả [các phần phụ thuộc bên ngoài] ( https://docs.aspose.com/ocr/net/system-requirements/#external- phụ thuộc) của gói Aspose.OCR được tham chiếu trong dự án của bạn.

  • Giải pháp tương thích NET Standard 2.0+
  • Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.

Mã mẫu này hiển thị Chuyển đổi từ JPEG2000 sang Searchable PDF .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG2000");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
  • JPEG2000 Là gì JPEG2000 Định dạng tệp

    JPEG 2000 (JP2) là một hệ thống mã hóa hình ảnh và tiêu chuẩn nén hình ảnh hiện đại nhất. Được thiết kế, sử dụng công nghệ wavelet JPEG 2000 có thể mã nội dung không mất dữ liệu ở bất kỳ chất lượng nào cùng một lúc. Hơn nữa, không có bất kỳ hình phạt đáng kể nào về hiệu quả mã hóa, JPEG 2000 có khả năng truy cập và giải mã hiệu quả cùng một nội dung thành nhiều độ phân giải và chất lượng khác. Các dòng mã trong JPEG 2000 có khả năng mở rộng đáng kể khi có các vùng quan tâm cung cấp cơ sở cho việc truy cập ngẫu nhiên theo không gian. Sở hữu tới 16384 linh kiện đa dạng với kích thước tính bằng terapixel và độ chính xác có thể cao tới 38 bit / mẫu.

    Đọc thêm

    Searchable PDF Là gì Searchable PDF Định dạng tệp

    Các tệp PDF có thể tìm kiếm giữ lại hình ảnh được quét gốc để xem, cũng như văn bản OCR trong một lớp ẩn có thể được sử dụng để tìm kiếm toàn văn trong tài liệu hoặc đánh dấu văn bản cho các thao tác sao chép và dán. Chuyển đổi OCR đầy đủ sang PDF, không bao gồm hình ảnh gốc, sẽ không bao giờ giữ lại 100% định dạng ban đầu, đặc biệt nếu tài liệu có nhiều hình ảnh hoặc bố cục phức tạp.

    Đọc thêm

    Các chuyển đổi được hỗ trợ khác

    Sử dụng C#, người ta có thể dễ dàng chuyển đổi các định dạng khác nhau bao gồm.

    TXT (Tệp tài liệu văn bản)
    Text (Tệp tài liệu văn bản)
    DOC (Tài liệu được tạo bởi Microsoft Word)
    DOCX (Tài liệu Microsoft Word)
    XLS (Định dạng tệp nhị phân Microsoft Excel)
    XLSX (Tài liệu Microsoft Excel)
    PDF (Định dạng tài liệu di động (PDF))
    Searchable PDF (Đồ họa mạng di động có thể tìm kiếm)
    XML (Ngôn ngữ đánh dấu có thể mở rộng)
    JSON (Ký hiệu đối tượng JavaScript)