HTML JPG OCR XML BMP
Aspose.OCR  cho .NET
DOCX

Chuyển đổi DJVU thành DOCX trong C#

Thực hiện nhận dạng ký tự quang học trên tài liệu DJVU và lưu văn bản dưới dạng tài liệu DJVU bằng thư viện Aspose.OCR fro .NET.

Cách chuyển đổi DJVU thành DOCX bằng C#

Aspose.OCR cho .NET là một thư viện mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để chuyển đổi hình ảnh DJVU sang tài liệu DOCX. Hỗ trợ 26 ngôn ngữ dựa trên tiếng Latinh, Cyrillic và Trung Quốc, công cụ nhận dạng ký tự quang học hiện đại của nó cung cấp tốc độ nhận dạng và độ chính xác vượt trội, đồng thời cách ly bạn khỏi các công thức, mạng nơ-ron và các chi tiết kỹ thuật phức tạp khác. Nó cho phép bạn thêm chức năng OCR vào các ứng dụng .NET của mình trong vòng chưa đầy 10 dòng mã.

[Aspose.OCR cho .NET] ( https://products.aspose.com/ocr/net ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng DJVU và tạo tài liệu DJVU chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần cài đặt * Aspose.OCR * [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) gói trong dự án của bạn bằng lệnh sau:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Các bước chuyển đổi DJVU thành DOCX

Với .NET OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh DJVU thành tài liệu DOCX:

  • Tạo một thể hiện của lớp AsposeOcr
  • Gọi phương thức AsposeOCR.RecognizeImage
  • Chuyển đường dẫn tệp DJVU làm tham số
  • AsposeOCR.RecognizeImage trả về một Chuỗi hoặc tệp thuộc loại DOCX

yêu cầu hệ thống

Trước khi chạy ví dụ, hãy đảm bảo rằng API .NET tương thích với đặc tả NET Standard 2.0 được cài đặt trên hệ thống của bạn và tất cả [các phần phụ thuộc bên ngoài] ( https://docs.aspose.com/ocr/net/system-requirements/#external- phụ thuộc) của gói Aspose.OCR được tham chiếu trong dự án của bạn.

  • Giải pháp tương thích NET Standard 2.0+
  • Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.

Mã mẫu này hiển thị Chuyển đổi từ DJVU sang DOCX .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOCX", riText);
  • DJVU Là gì DJVU Định dạng tệp

    DjVu, được phát âm là “déjà vu”, là một định dạng tệp đồ họa dành cho các tài liệu và sách được quét, đặc biệt là những tài liệu có chứa sự kết hợp của văn bản, bản vẽ, hình ảnh và ảnh chụp. Nó được phát triển bởi AT&T Labs. Nó sử dụng nhiều kỹ thuật như tách lớp hình ảnh của văn bản và hình ảnh nền, tải liên tục, mã hóa số học và nén mất dữ liệu cho hình ảnh bitonal. Vì tệp DJVU có thể chứa hình ảnh, ảnh, văn bản và bản vẽ màu được nén nhưng chất lượng cao và có thể được lưu trong ít dung lượng hơn, do đó, nó được sử dụng trên web dưới dạng sách điện tử, sách hướng dẫn, báo chí, tài liệu cổ, v.v.

    Đọc thêm

    DOCX Là gì DOCX Định dạng tệp

    DOCX là một định dạng nổi tiếng cho tài liệu Microsoft Word. Được giới thiệu từ năm 2007 với việc phát hành Microsoft Office 2007, cấu trúc của định dạng Tài liệu mới này đã được thay đổi từ dạng nhị phân thuần túy sang dạng kết hợp của tệp nhị phân và XML. Tệp Docx có thể được mở bằng Word 2007 và các phiên bản bên nhưng không mở được bằng các phiên bản MS Word trước đó hỗ trợ phần mở rộng tệp DOC.

    Đọc thêm

    Các chuyển đổi được hỗ trợ khác

    Sử dụng C#, người ta có thể dễ dàng chuyển đổi các định dạng khác nhau bao gồm.

    TXT (Tệp tài liệu văn bản)
    Text (Tệp tài liệu văn bản)
    DOC (Tài liệu được tạo bởi Microsoft Word)
    DOCX (Tài liệu Microsoft Word)
    XLS (Định dạng tệp nhị phân Microsoft Excel)
    XLSX (Tài liệu Microsoft Excel)
    PDF (Định dạng tài liệu di động (PDF))
    Searchable PDF (Đồ họa mạng di động có thể tìm kiếm)
    XML (Ngôn ngữ đánh dấu có thể mở rộng)
    JSON (Ký hiệu đối tượng JavaScript)