Chuyển đổi TIFF thành Searchable PDF trong C#
Thực hiện nhận dạng ký tự quang học trên tài liệu TIFF và lưu văn bản dưới dạng tài liệu TIFF bằng thư viện Aspose.OCR fro .NET.
Cách chuyển đổi TIFF thành Searchable PDF bằng C#
Aspose.OCR cho .NET là một thư viện mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để chuyển đổi hình ảnh TIFF sang tài liệu Searchable PDF. Hỗ trợ 26 ngôn ngữ dựa trên tiếng Latinh, Cyrillic và Trung Quốc, công cụ nhận dạng ký tự quang học hiện đại của nó cung cấp tốc độ nhận dạng và độ chính xác vượt trội, đồng thời cách ly bạn khỏi các công thức, mạng nơ-ron và các chi tiết kỹ thuật phức tạp khác. Nó cho phép bạn thêm chức năng OCR vào các ứng dụng .NET của mình trong vòng chưa đầy 10 dòng mã.
[Aspose.OCR cho .NET] ( https://products.aspose.com/ocr/net ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng TIFF và tạo tài liệu TIFF chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần cài đặt * Aspose.OCR * [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) gói trong dự án của bạn bằng lệnh sau:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Các bước chuyển đổi TIFF thành Searchable PDF
Với .NET OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh TIFF thành tài liệu Searchable PDF:
- Tạo một thể hiện của lớp AsposeOcr
- Gọi phương thức AsposeOCR.RecognizeImage
- Chuyển đường dẫn tệp TIFF làm tham số
- AsposeOCR.RecognizeImage trả về một Chuỗi hoặc tệp thuộc loại Searchable PDF
yêu cầu hệ thống
Trước khi chạy ví dụ, hãy đảm bảo rằng API .NET tương thích với đặc tả NET Standard 2.0 được cài đặt trên hệ thống của bạn và tất cả [các phần phụ thuộc bên ngoài] ( https://docs.aspose.com/ocr/net/system-requirements/#external- phụ thuộc) của gói Aspose.OCR được tham chiếu trong dự án của bạn.
- Giải pháp tương thích NET Standard 2.0+
- Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.
Mã mẫu này hiển thị Chuyển đổi từ TIFF sang Searchable PDF .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.TIFF");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
TIFF Là gì TIFF Định dạng tệp
TIFF hoặc TIF, Định dạng tệp hình ảnh được gắn thẻ, đại diện cho hình ảnh raster được sử dụng trên nhiều thiết bị tuân thủ tiêu chuẩn định dạng tệp này. Nó có khả năng mô tả dữ liệu hình ảnh mức độ mật, thang độ xám, bảng màu và dữ liệu hình ảnh đầy đủ màu sắc trong một số không gian màu. Nó hỗ trợ các lược đồ nén mất dữ liệu cũng như không mất dữ liệu để lựa chọn giữa không gian và thời gian cho các ứng dụng sử dụng định dạng. Định dạng này có thể mở rộng và đã trải qua một số sửa đổi cho phép đưa vào một lượng thông tin cá nhân hoặc mục đích đặc biệt không giới hạn. Định dạng không phụ thuộc vào máy và không bị giới hạn như bộ xử lý, hệ điều hành hoặc hệ thống tệp.
Đọc thêmSearchable PDF Là gì Searchable PDF Định dạng tệp
Các tệp PDF có thể tìm kiếm giữ lại hình ảnh được quét gốc để xem, cũng như văn bản OCR trong một lớp ẩn có thể được sử dụng để tìm kiếm toàn văn trong tài liệu hoặc đánh dấu văn bản cho các thao tác sao chép và dán. Chuyển đổi OCR đầy đủ sang PDF, không bao gồm hình ảnh gốc, sẽ không bao giờ giữ lại 100% định dạng ban đầu, đặc biệt nếu tài liệu có nhiều hình ảnh hoặc bố cục phức tạp.
Đọc thêmCác chuyển đổi được hỗ trợ khác
Sử dụng C#, người ta có thể dễ dàng chuyển đổi các định dạng khác nhau bao gồm.