Chuyển đổi PDF thành XLS trong C#
Thực hiện nhận dạng ký tự quang học trên tài liệu PDF và lưu văn bản dưới dạng tài liệu PDF bằng thư viện Aspose.OCR fro .NET.
Cách chuyển đổi PDF thành XLS bằng C#
Aspose.OCR cho .NET là một thư viện mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để chuyển đổi hình ảnh PDF sang tài liệu XLS. Hỗ trợ 26 ngôn ngữ dựa trên tiếng Latinh, Cyrillic và Trung Quốc, công cụ nhận dạng ký tự quang học hiện đại của nó cung cấp tốc độ nhận dạng và độ chính xác vượt trội, đồng thời cách ly bạn khỏi các công thức, mạng nơ-ron và các chi tiết kỹ thuật phức tạp khác. Nó cho phép bạn thêm chức năng OCR vào các ứng dụng .NET của mình trong vòng chưa đầy 10 dòng mã.
[Aspose.OCR cho .NET] ( https://products.aspose.com/ocr/net ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng PDF và tạo tài liệu PDF chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần cài đặt * Aspose.OCR * [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) gói trong dự án của bạn bằng lệnh sau:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Các bước chuyển đổi PDF thành XLS
Với .NET OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh PDF thành tài liệu XLS:
- Tạo một thể hiện của lớp AsposeOcr
- Gọi phương thức AsposeOCR.RecognizeImage
- Chuyển đường dẫn tệp PDF làm tham số
- AsposeOCR.RecognizeImage trả về một Chuỗi hoặc tệp thuộc loại XLS
yêu cầu hệ thống
Trước khi chạy ví dụ, hãy đảm bảo rằng API .NET tương thích với đặc tả NET Standard 2.0 được cài đặt trên hệ thống của bạn và tất cả [các phần phụ thuộc bên ngoài] ( https://docs.aspose.com/ocr/net/system-requirements/#external- phụ thuộc) của gói Aspose.OCR được tham chiếu trong dự án của bạn.
- Giải pháp tương thích NET Standard 2.0+
- Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.
Mã mẫu này hiển thị Chuyển đổi từ PDF sang XLS .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.XLS", riText);
PDF Là gì PDF Định dạng tệp
Định dạng tài liệu di động (PDF) là một loại tài liệu được tạo bởi Adobe vào những năm 1990. Mục đích của định dạng tệp này là giới thiệu một tiêu chuẩn để trình bày tài liệu và tài liệu tham khảo khác ở định dạng độc lập với phần mềm ứng dụng, phần cứng cũng như Hệ điều hành. Định dạng tệp PDF có đầy đủ khả năng chứa thông tin như văn bản, hình ảnh, siêu liên kết, trường biểu mẫu, đa phương tiện, chữ ký số, tệp đính kèm, siêu dữ liệu, các tính năng không gian địa lý và các đối tượng 3D trong đó có thể trở thành một phần của tài liệu nguồn.
Đọc thêmXLS Là gì XLS Định dạng tệp
Các tệp có phần mở rộng XLS đại diện cho Định dạng tệp nhị phân của Excel. Các tệp như vậy có thể được tạo bởi Microsoft Excel cũng như các chương trình bảng tính tương tự khác như OpenOffice Calc hoặc Apple Numbers. Tệp được lưu bởi Excel được gọi là Sổ làm việc trong đó mỗi sổ làm việc có thể có một hoặc nhiều trang tính. Dữ liệu được lưu trữ và hiển thị cho người dùng ở định dạng bảng trong trang tính và có thể mở rộng giá trị số, dữ liệu văn bản, công thức, kết nối dữ liệu bên ngoài, hình ảnh và biểu đồ. Các ứng dụng như Microsoft Excel cho phép bạn xuất dữ liệu sổ làm việc sang một số định dạng khác nhau bao gồm PDF, CSV, XLSX, TXT, HTML, XPS và một số định dạng khác. Định dạng tệp XLS đã được thay thế bằng định dạng có cấu trúc và mở hơn, XLSX, với việc phát hành Microsoft Excel 2007. Các phiên bản mới nhất vẫn cung cấp hỗ trợ để tạo và đọc tệp XLS, mặc dù XLSX là lựa chọn sử dụng hàng đầu hiện nay.
Đọc thêmCác chuyển đổi được hỗ trợ khác
Sử dụng C#, người ta có thể dễ dàng chuyển đổi các định dạng khác nhau bao gồm.