HTML JPG OCR XML BMP
Aspose.OCR  cho .NET
XML

Chuyển đổi PNG thành XML trong C#

Thực hiện nhận dạng ký tự quang học trên tài liệu PNG và lưu văn bản dưới dạng tài liệu PNG bằng thư viện Aspose.OCR fro .NET.

Cách chuyển đổi PNG thành XML bằng C#

Aspose.OCR cho .NET là một thư viện mạnh mẽ nhưng dễ sử dụng và tiết kiệm chi phí để chuyển đổi hình ảnh PNG sang tài liệu XML. Hỗ trợ 26 ngôn ngữ dựa trên tiếng Latinh, Cyrillic và Trung Quốc, công cụ nhận dạng ký tự quang học hiện đại của nó cung cấp tốc độ nhận dạng và độ chính xác vượt trội, đồng thời cách ly bạn khỏi các công thức, mạng nơ-ron và các chi tiết kỹ thuật phức tạp khác. Nó cho phép bạn thêm chức năng OCR vào các ứng dụng .NET của mình trong vòng chưa đầy 10 dòng mã.

[Aspose.OCR cho .NET] ( https://products.aspose.com/ocr/net ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng PNG và tạo tài liệu PNG chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần cài đặt * Aspose.OCR * [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) gói trong dự án của bạn bằng lệnh sau:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Các bước chuyển đổi PNG thành XML

Với .NET OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh PNG thành tài liệu XML:

  • Tạo một thể hiện của lớp AsposeOcr
  • Gọi phương thức AsposeOCR.RecognizeImage
  • Chuyển đường dẫn tệp PNG làm tham số
  • AsposeOCR.RecognizeImage trả về một Chuỗi hoặc tệp thuộc loại XML

yêu cầu hệ thống

Trước khi chạy ví dụ, hãy đảm bảo rằng API .NET tương thích với đặc tả NET Standard 2.0 được cài đặt trên hệ thống của bạn và tất cả [các phần phụ thuộc bên ngoài] ( https://docs.aspose.com/ocr/net/system-requirements/#external- phụ thuộc) của gói Aspose.OCR được tham chiếu trong dự án của bạn.

  • Giải pháp tương thích NET Standard 2.0+
  • Aspose.OCR cho .NET được tham chiếu trong dự án của bạn.

Mã mẫu này hiển thị Chuyển đổi từ PNG sang XML .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PNG");
// print text
File. File.WriteAllText("document.XML", riText);
  • PNG Là gì PNG Định dạng tệp

    PNG, Đồ họa mạng di động, đề cập đến một loại định dạng tệp hình ảnh raster sử dụng tính năng nén không có lỗ. Định dạng tệp này được tạo để thay thế cho Định dạng trao đổi đồ họa (GIF) và không có giới hạn bản quyền. Tuy nhiên, định dạng tệp PNG không hỗ trợ hình ảnh động. Định dạng tệp PNG hỗ trợ nén hình ảnh vô tận khiến nó trở nên phổ biến đối với người dùng. Theo thời gian, PNG đã phát triển như một trong những định dạng tệp hình ảnh được sử dụng nhiều nhất. Hầu hết tất cả các Hệ điều hành đều có hỗ trợ mở tệp PNG. Ví dụ, trình xem Microsoft Windows có khả năng mở tệp PNG vì theo mặc định, hệ điều hành có hỗ trợ sẵn có như một phần của quá trình cài đặt.

    Đọc thêm

    XML Là gì XML Định dạng tệp

    XML là viết tắt của Extensible Markup Language tương tự như HTML nhưng khác ở việc sử dụng các thẻ để xác định các đối tượng. Toàn bộ ý tưởng đằng sau việc tạo ra định dạng tệp XML là để lưu trữ và vận chuyển dữ liệu mà không phụ thuộc vào phần mềm hoặc công cụ phần cứng. Sự phổ biến của nó là do nó có thể đọc được cả con người cũng như máy móc. Điều này cho phép nó tạo ra các giao thức dữ liệu chung dưới dạng các đối tượng được lưu trữ và chia sẻ qua mạng như World Wide Web (WWW). Chữ “X” trong XML có nghĩa là có thể mở rộng, ngụ ý rằng ngôn ngữ có thể được mở rộng cho bất kỳ số lượng ký hiệu nào theo yêu cầu của người dùng. Chính vì những tính năng này mà nhiều định dạng tệp tiêu chuẩn sử dụng nó như Microsoft Open XML, LibreOffice OpenDocument, XHTML và SVG.

    Đọc thêm

    Các chuyển đổi được hỗ trợ khác

    Sử dụng C#, người ta có thể dễ dàng chuyển đổi các định dạng khác nhau bao gồm.

    TXT (Tệp tài liệu văn bản)
    Text (Tệp tài liệu văn bản)
    DOC (Tài liệu được tạo bởi Microsoft Word)
    DOCX (Tài liệu Microsoft Word)
    XLS (Định dạng tệp nhị phân Microsoft Excel)
    XLSX (Tài liệu Microsoft Excel)
    PDF (Định dạng tài liệu di động (PDF))
    Searchable PDF (Đồ họa mạng di động có thể tìm kiếm)
    XML (Ngôn ngữ đánh dấu có thể mở rộng)
    JSON (Ký hiệu đối tượng JavaScript)