HTML JPG OCR XML BMP
Aspose.OCR  cho Java
XML

[Aspose.Imaging cho Java] ( https://products.aspose.com/imaging/java ) xử lý hình ảnh được quét hoặc thậm chí ảnh điện thoại thông minh ở định dạng PNG và tạo tài liệu PNG chứa văn bản được nhận dạng. Để thêm nó vào dự án của bạn, bạn chỉ cần lấy * Aspose.OCR * [Maven] ( https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging ) hoặc chỉ định cấu hình kho lưu trữ Aspose Maven và cài đặt nó trong dự án dựa trên Maven của bạn bằng cách thêm các cấu hình sau vào pom.xml. Đối với các ví dụ về Graddle, Ivy, Sbt, hãy xem [kho lưu trữ] của chúng tôi ( https://repository.aspose.com/ocr/) .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Với Java OCR và chỉ một vài dòng mã, bạn có thể tạo ứng dụng đầy đủ tính năng để chuyển đổi hình ảnh PNG thành tài liệu XML:

  • Tạo một thể hiện của lớp AsposeOcr
  • Gọi phương thức AsposeOCR.RecognizePage
  • Chuyển đường dẫn tệp PNG làm tham số
  • AsposeOCR.RecognizePage trả về một Chuỗi hoặc tệp thuộc loại XML

yêu cầu hệ thống

Trước khi chạy ví dụ này, hãy đảm bảo rằng Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) trở lên được cài đặt trên hệ thống của bạn.

  • Đã cài đặt JDK 1.6 trở lên.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • PNG Là gì PNG Định dạng tệp

    PNG, Đồ họa mạng di động, đề cập đến một loại định dạng tệp hình ảnh raster sử dụng tính năng nén không có lỗ. Định dạng tệp này được tạo để thay thế cho Định dạng trao đổi đồ họa (GIF) và không có giới hạn bản quyền. Tuy nhiên, định dạng tệp PNG không hỗ trợ hình ảnh động. Định dạng tệp PNG hỗ trợ nén hình ảnh vô tận khiến nó trở nên phổ biến đối với người dùng. Theo thời gian, PNG đã phát triển như một trong những định dạng tệp hình ảnh được sử dụng nhiều nhất. Hầu hết tất cả các Hệ điều hành đều có hỗ trợ mở tệp PNG. Ví dụ, trình xem Microsoft Windows có khả năng mở tệp PNG vì theo mặc định, hệ điều hành có hỗ trợ sẵn có như một phần của quá trình cài đặt.

    Đọc thêm

    XML Là gì XML Định dạng tệp

    XML là viết tắt của Extensible Markup Language tương tự như HTML nhưng khác ở việc sử dụng các thẻ để xác định các đối tượng. Toàn bộ ý tưởng đằng sau việc tạo ra định dạng tệp XML là để lưu trữ và vận chuyển dữ liệu mà không phụ thuộc vào phần mềm hoặc công cụ phần cứng. Sự phổ biến của nó là do nó có thể đọc được cả con người cũng như máy móc. Điều này cho phép nó tạo ra các giao thức dữ liệu chung dưới dạng các đối tượng được lưu trữ và chia sẻ qua mạng như World Wide Web (WWW). Chữ “X” trong XML có nghĩa là có thể mở rộng, ngụ ý rằng ngôn ngữ có thể được mở rộng cho bất kỳ số lượng ký hiệu nào theo yêu cầu của người dùng. Chính vì những tính năng này mà nhiều định dạng tệp tiêu chuẩn sử dụng nó như Microsoft Open XML, LibreOffice OpenDocument, XHTML và SVG.

    Đọc thêm

    TXT (Tệp tài liệu văn bản)
    Text (Tệp tài liệu văn bản)
    DOC (Tài liệu được tạo bởi Microsoft Word)
    DOCX (Tài liệu Microsoft Word)
    XLS (Định dạng tệp nhị phân Microsoft Excel)
    XLSX (Tài liệu Microsoft Excel)
    PDF (Định dạng tài liệu di động (PDF))
    Searchable PDF (Đồ họa mạng di động có thể tìm kiếm)
    XML (Ngôn ngữ đánh dấu có thể mở rộng)
    JSON (Ký hiệu đối tượng JavaScript)