Tại sao chọn Aspose.OCR cho Java?

Khám phá thế giới liền mạch của Aspose.OCR dành cho Java - API OCR mạnh mẽ, dễ sử dụng và tiết kiệm chi phí. Với ít hơn 5 dòng mã Java, hãy thêm chức năng OCR vào ứng dụng của bạn mà không cần đi sâu vào các mạng thần kinh hoặc toán học phức tạp. Công cụ OCR mạnh mẽ của chúng tôi tự hào có tốc độ và độ chính xác vượt trội, hỗ trợ 28 ngôn ngữ, bao gồm chữ Latinh, Cyrillic và tiếng Trung. Từ hình ảnh được quét và ảnh trên điện thoại thông minh đến ảnh chụp màn hình và tệp PDF được quét, truy xuất kết quả ở các định dạng trao đổi dữ liệu và tài liệu phổ biến. Hưởng lợi từ các bộ lọc tiền xử lý xử lý hình ảnh bị xoay, lệch và nhiễu. Tối ưu hóa hiệu suất nhận dạng và tải hệ thống bằng cách giảm tải các tác vụ tiêu tốn nhiều tài nguyên cho GPU.

Illustration ocr

OCR nhanh và chính xác

Đạt được kết quả OCR tốc độ cao và chính xác bằng công nghệ Java tiên tiến của chúng tôi.

Hỗ trợ đa ngôn ngữ

Nhận dạng văn bản bằng 28 ngôn ngữ, bao gồm chữ Latinh, chữ Cyrillic và tiếng Trung.

Hỗ trợ hình ảnh thích ứng

Xử lý hình ảnh từ nhiều nguồn khác nhau, chẳng hạn như máy quét, máy ảnh và điện thoại thông minh.

Thành thạo ký tự Trung Quốc

Nhận dạng hơn 6.000 ký tự tiếng Trung với độ chính xác tuyệt vời.

Kiểu phông chữ và tính toàn vẹn định dạng

Giữ nguyên kiểu phông chữ và định dạng để thể hiện trung thực văn bản Java được nhận dạng.

Mẫu mã trực tiếp

Trải nghiệm sự đơn giản: Chuyển đổi hình ảnh thành văn bản chỉ trong vài dòng mã Java!

Sẵn sàng công nhận Sẵn sàng công nhận Thả một tập tin ở đây hoặc bấm vào để duyệt *

* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụngChính sách bảo mật.

Kết quả công nhận
 

Chuyển đổi hình ảnh thành văn bản

Khám phá thêm ví dụ >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java ở mọi nơi

Aspose.OCR dành cho Java hoạt động liền mạch trên mọi nền tảng hỗ trợ Java SE 6.0 trở lên – có thể là máy cục bộ, máy chủ web hoặc đám mây.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Các định dạng tập tin được hỗ trợ

Aspose.OCR for Java có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.

Hình ảnh

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR hàng loạt

  • Multi-page PDF
  • ZIP
  • Folder

Kết quả công nhận

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Cài đặt dễ dàng

Aspose.OCR dành cho Java được phân phối dưới dạng tệp Lưu trữ Java (JAR) nhẹ hoặc dưới dạng tệp có thể tải xuống với mức độ phụ thuộc tối thiểu. Chỉ cần cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.

Java, mọi nơi

Thư viện của chúng tôi hỗ trợ đầy đủ Java SE 6 trở lên, cho phép các ứng dụng của bạn chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.

28 ngôn ngữ nhận dạng

API Java OCR của chúng tôi nhận dạng nhiều ngôn ngữ và tập lệnh viết phổ biến, bao gồm cả các ngôn ngữ hỗn hợp:

Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.

  • Bảng chữ cái Latin mở rộng: tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Rumani, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển;
  • Bảng chữ cái Cyrillic: tiếng Belorussian, tiếng Bulgaria, tiếng Kazakhstan, tiếng Nga, tiếng Serbia, tiếng Ukraina;
  • Hơn 6.000 ký tự tiếng Trung;
  • Tiếng Hindi.

Trao quyền cho các tính năng và khả năng

Aspose.OCR for Java Khám phá các tính năng và khả năng nâng cao của Aspose.OCR cho Java.

Feature icon

Ảnh OCR

Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức quét.

Feature icon

PDF có thể tìm kiếm

Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.

Feature icon

Nhận dạng URL

Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.

Feature icon

Nhận dạng hàng loạt

Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.

Feature icon

Bất kỳ phông chữ và phong cách

Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.

Feature icon

Tinh chỉnh nhận dạng

Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.

Feature icon

Công cụ kiểm tra chính tả

Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.

Feature icon

Tìm văn bản trong hình ảnh

Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.

Feature icon

So sánh văn bản hình ảnh

So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.

Feature icon

Nhận dạng hình ảnh liên kết web

Nhận dạng liền mạch hình ảnh trực tiếp từ các liên kết web, tăng cường tích hợp OCR trong các dự án Java của bạn.

Feature icon

Tự động sửa từ sai chính tả

Nâng cao kết quả OCR bằng cách tự động sửa các từ sai chính tả, đảm bảo độ chính xác trong các ứng dụng Java của bạn.

Feature icon

Tích hợp hoàn toàn với hệ sinh thái Aspose

Tích hợp Aspose.OCR cho Java một cách liền mạch với các sản phẩm Aspose khác để có giải pháp Java toàn diện và hiệu quả.

Mẫu mã

Khám phá các mẫu mã để tìm hiểu cách tích hợp liền mạch Aspose.OCR cho Java vào các ứng dụng của bạn.

Cài đặt

Là tệp Lưu trữ Java (JAR) có mức phụ thuộc tối thiểu hoặc từ kho lưu trữ Maven, Aspose.OCR cho Java được phân phối dễ dàng. Tích hợp vào dự án của bạn, trực tiếp từ Môi trường phát triển tích hợp Java (IDE) ưa thích của bạn, là một quá trình liền mạch. Chỉ cần cài đặt nó và bạn đã sẵn sàng tận dụng toàn bộ khả năng OCR, lưu kết quả nhận dạng ở bất kỳ định dạng nào được hỗ trợ.

Sau khi cài đặt, bạn có thể nhanh chóng bắt đầu sử dụng Aspose.OMR cho Java , mặc dù có những hạn chế nhất định. Giấy phép tạm thời dỡ bỏ tất cả các hạn chế về phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Java ở giai đoạn sau.

Nhận dạng văn bản trên hình ảnh được quét trong Java

Vượt qua thách thức của các ứng dụng OCR thiếu máy quét phổ biến. API của chúng tôi tự hào có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ giúp xử lý thành thạo các hình ảnh bị xoay, lệch và nhiễu. Kết hợp với sự hỗ trợ cho tất cả các định dạng hình ảnh, nó đảm bảo khả năng nhận dạng đáng tin cậy ngay cả từ ảnh trên điện thoại thông minh. Hầu hết quá trình xử lý trước và chỉnh sửa hình ảnh đều được tự động hóa, chỉ yêu cầu bạn can thiệp trong những trường hợp khó khăn.

Áp dụng Chỉnh sửa hình ảnh tự động - Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

Trích xuất văn bản từ ảnh trong Java

Tích hợp tính năng phát hiện và nhận dạng văn bản trong các ứng dụng Java của bạn. Truy cập kết quả chính xác từ ảnh một cách dễ dàng, nâng cao khả năng xử lý ảnh của bạn. Nâng cao khả năng xử lý hình ảnh, thu được kết quả chính xác từ ảnh.

Phát hiện và nhận dạng văn bản trên ảnh - Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Tối ưu hóa tài nguyên trong Java

Nhận dạng ký tự quang học đòi hỏi tài nguyên. API của chúng tôi cung cấp những cách linh hoạt để cân bằng bộ ba chất lượng-giá cả-thời gian cổ điển. Nó cho phép bạn hạn chế số lượng luồng được sử dụng bởi công cụ nhận dạng. Mặc dù việc điều chỉnh này có thể dẫn đến tốc độ nhận dạng chậm hơn nhưng nó cho phép bạn phân bổ tài nguyên cho các tác vụ đồng thời như xử lý hình ảnh song song, vận hành máy chủ web, quản lý cơ sở dữ liệu hoặc phân tích dữ liệu nền.

  • Chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
  • Chỉ định số lượng luồng được phân bổ để nhận dạng hoặc cho phép thư viện tự động chia tỷ lệ theo số lõi bộ xử lý.
  • Giải phóng CPU bằng cách giảm tải các phép tính cho GPU.

Cân bằng sử dụng tài nguyên

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

Nhận dạng nhanh với thiết lập tối thiểu

Nếu hình ảnh của bạn là bản quét chất lượng cao mà không bị lệch hoặc biến dạng, bạn có thể sử dụng chế độ nhận dạng nhanh nhất tiêu tốn tài nguyên tối thiểu có thể bằng cách sử dụng:

OCR nhận dạng nhanh - Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});