Chuyển đổi JPG thành DOC trong C#
Thực hiện nhận dạng ký tự quang học trên tài liệu JPG và lưu văn bản dưới dạng tài liệu JPG bằng thư viện Aspose.OCR fro .NET.
Cách chuyển đổi JPG thành DOC bằng C#
Aspose.OCR cho .NET là một thư viện mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để chuyển đổi hình ảnh JPG sang tài liệu DOC. Hỗ trợ 26 ngôn ngữ dựa trên tiếng Latinh, Cyrillic và Trung Quốc, công cụ nhận dạng ký tự quang học hiện đại của nó cung cấp tốc độ nhận dạng và độ chính xác vượt trội, đồng thời cách ly bạn khỏi các công thức, mạng nơ-ron và các chi tiết kỹ thuật phức tạp khác. Nó cho phép bạn thêm chức năng OCR vào các ứng dụng .NET của mình trong vòng chưa đầy 10 dòng mã.
[Aspose.OCR cho .NET] ( https://products.aspose.com/ocr/net ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng JPG và tạo tài liệu JPG chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần cài đặt * Aspose.OCR * [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) gói trong dự án của bạn bằng lệnh sau:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Các bước chuyển đổi JPG thành DOC
Với .NET OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh JPG thành tài liệu DOC:
- Tạo một thể hiện của lớp AsposeOcr
- Gọi phương thức AsposeOCR.RecognizeImage
- Chuyển đường dẫn tệp JPG làm tham số
- AsposeOCR.RecognizeImage trả về một Chuỗi hoặc tệp thuộc loại DOC
yêu cầu hệ thống
Trước khi chạy ví dụ, hãy đảm bảo rằng API .NET tương thích với đặc tả NET Standard 2.0 được cài đặt trên hệ thống của bạn và tất cả [các phần phụ thuộc bên ngoài] ( https://docs.aspose.com/ocr/net/system-requirements/#external- phụ thuộc) của gói Aspose.OCR được tham chiếu trong dự án của bạn.
- Giải pháp tương thích NET Standard 2.0+
- Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.
Mã mẫu này hiển thị Chuyển đổi từ JPG sang DOC .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPG");
// print text
File. File.WriteAllText("document.DOC", riText);
JPG Là gì JPG Định dạng tệp
JPEG là một loại định dạng hình ảnh được lưu bằng phương pháp nén mất dữ liệu. Hình ảnh đầu ra, là kết quả của quá trình nén, là sự cân bằng giữa kích thước lưu trữ và chất lượng hình ảnh. Người dùng có thể điều chỉnh mức độ nén để đạt được mức chất lượng mong muốn đồng thời giảm dung lượng lưu trữ. Chất lượng hình ảnh bị ảnh hưởng đáng kể nếu áp dụng nén 10: 1 cho hình ảnh. Giá trị nén càng cao thì chất lượng ảnh càng giảm.
Đọc thêmDOC Là gì DOC Định dạng tệp
Các tệp có phần mở rộng .doc đại diện cho các tài liệu được tạo bởi Microsoft Word hoặc các tài liệu xử lý văn bản khác ở định dạng tệp nhị phân. Phần mở rộng ban đầu được sử dụng cho tài liệu văn bản thuần túy trên một số hệ điều hành khác nhau. Nó có thể chứa một số loại dữ liệu khác nhau như hình ảnh, được định dạng cũng như văn bản thuần túy, đồ thị, biểu đồ, đối tượng nhúng, liên kết, trang, định dạng trang, cài đặt in và nhiều thứ khác. Định dạng này phổ biến cho tất cả các loại tài liệu do có nhiều tùy chọn mà nó cung cấp cho người dùng để viết hướng dẫn sử dụng, đề xuất, thông số kỹ thuật, sơ yếu lý lịch, bài báo hoặc bất kỳ tài liệu nào tương tự. Phiên bản cập nhật của DOC là DOCX dựa trên Office OpenXML có thông số kỹ thuật được cung cấp công khai.
Đọc thêmCác chuyển đổi được hỗ trợ khác
Sử dụng C#, người ta có thể dễ dàng chuyển đổi các định dạng khác nhau bao gồm.