Hình ảnh để nhắn tin với API Java OCR
Chuyển đổi hình ảnh thành văn bản trong Java
Thêm giới thiệu >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Tại sao chọn Thư viện OCR cho Java?
Mở khóa OCR mạnh mẽ với Thư viện Java OCR. API Java của chúng tôi là một API OCR hiệu quả, thân thiện với người dùng và hiệu quả về chi phí. Chỉ trong năm dòng mã Java, thêm chức năng OCR mạnh mẽ vào các ứng dụng của bạn mà không cần phải hiểu các mạng thần kinh và các chi tiết kỹ thuật khác. Cho dù bạn làm việc với quét, ảnh điện thoại thông minh, ảnh chụp màn hình hoặc PDFS, OCR của chúng tôi trích xuất văn bản và tạo kết quả ở tất cả các định dạng phổ biến.

OCR nhanh và chính xác
Đạt được kết quả OCR tốc độ cao và chính xác với công nghệ Java tiên tiến của chúng tôi.
Hỗ trợ đa ngôn ngữ
Nhận biết văn bản bằng hơn 140 ngôn ngữ, bao gồm tiếng Anh, tiếng Pháp, Cyrillic, tiếng Ả Rập, tiếng Ba Tư, chỉ, tiếng Trung, tiếng Nhật, tiếng Hàn, tiếng Tamil và các kịch bản khác.
Tất cả hình ảnh
Xử lý hình ảnh từ nhiều nguồn khác nhau, chẳng hạn như máy quét, máy ảnh và điện thoại thông minh.
Phát hiện ngôn ngữ hỗn hợp
Nhận biết các tài liệu được viết bằng các ngôn ngữ hỗn hợp, chẳng hạn như tiếng Trung/tiếng Anh, tiếng Ả Rập/tiếng Pháp, tiếng Hindi/tiếng Anh và cyrillic/tiếng Anh.
Bất kỳ phông chữ, kiểu và định dạng
Bảo tồn chính xác bố cục văn bản, phát hiện cấu trúc bảng và nhận dạng liền mạch văn bản bất kể kiểu phông chữ.
Mẫu mã trực tiếp
Trải nghiệm sự đơn giản: Chuyển đổi hình ảnh thành văn bản trong một vài dòng mã Java
* Bằng cách tải lên các tệp của bạn hoặc sử dụng dịch vụ mà bạn đồng ý với Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Khám phá thêm các ví dụ >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Đa nền tảng
Mã Java OCR hoạt động liền mạch trên bất kỳ nền tảng nào hỗ trợ Java SE 6.0 trở lên -Có thể là máy địa phương, máy chủ web hoặc đám mây.
Các định dạng tệp được hỗ trợ
Aspose.OCR for Java có thể làm việc với bất kỳ tệp Bạn có thể nhận được từ máy quét hoặc máy ảnh. Kết quả nhận dạng có thể được lưu, nhập vào cơ sở dữ liệu hoặc được phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Lô OCR
- Multi-page PDF
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Cài đặt dễ dàng
Aspose.oc cho java được phân phối dưới dạng tệp lưu trữ Java (JAR) nhẹ hoặc dưới dạng tệp có thể tải xuống với các phụ thuộc tối thiểu. Đơn giản chỉ cần cài đặt Nó vào dự án của bạn và tất cả bạn đều được thiết lập để nhận ra các văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở các định dạng khác nhau.
Yêu cầu giấy phép dùng thử để khởi động sự phát triển của một ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
Hoạt động ở mọi nơi
Thư viện Java của chúng tôi hỗ trợ đầy đủ Java SE 6 trở lên, cho phép các ứng dụng của bạn chạy liền mạch trên bất kỳ nền tảng nào - Windows Desktop, Windows Server, MacOS, Linux và Cloud.
140 ngôn ngữ nhận dạng
Thư viện Java OCR của chúng tôi là một giải pháp phổ quát để xử lý tài liệu, trích xuất dữ liệu và số hóa nội dung trên quy mô toàn cầu. Với sự hỗ trợ cho một loạt các kịch bản viết châu Âu, Trung Đông và Châu Á, nó được thích nghi tốt với bất kỳ quốc gia và doanh nghiệp nào.
Aspose OCR cho Java nhận ra văn bản trong các tài liệu đa ngôn ngữ, chẳng hạn như tiếng Trung/Anh, tiếng Ả Rập/tiếng Pháp hoặc cyrillic/tiếng Anh. Các ngôn ngữ sau được hỗ trợ:
- ** Latin mở rộng **: Tiếng Anh, Tây Ban Nha, Pháp, Indonesia, Bồ Đào Nha, Đức, Việt Nam, Thổ Nhĩ Kỳ, Ý, Ba Lan, và hơn 80 người khác;
- ** Cyrillic ** Bảng chữ cái: Nga, Ukraine, Kazakh, Bulgaria, bao gồm các văn bản cyrillic/tiếng Anh hỗn hợp;
- Ả Rập, tiếng Ba Tư, tiếng Urdu, bao gồm các văn bản trộn với tiếng Anh;
- Các ngôn ngữ Trung Quốc, tiếng Hàn, Nhật Bản, Devanagari và Dravidian, bao gồm tiếng Hindi, tiếng Tamil, Marathi và những người khác.
Tính năng và khả năng
Aspose.OCR for Java Khám phá các tính năng và khả năng nâng cao của Aspose OCR cho Java.
Ảnh OCR
Trích xuất văn bản từ ảnh điện thoại thông minh với độ chính xác cấp quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ lần quét thành một tài liệu có thể tìm kiếm và có thể chỉnh sửa.
Công nhận URL
Nhận ra một hình ảnh từ URL mà không tải xuống cục bộ.
Công nhận số lượng lớn
Đọc tất cả các hình ảnh từ các tài liệu, thư mục và tài liệu lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản trong tất cả các kiểu chữ và kiểu phổ biến.
Công nhận tinh chỉnh
Điều chỉnh mọi tham số OCR cho kết quả nhận dạng tốt nhất.
Checker chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp các hình ảnh.
So sánh văn bản hình ảnh
So sánh các văn bản trên hai hình ảnh, bất kể trường hợp và bố cục.
Trên toàn thế giới
Trích xuất văn bản của bất kỳ ngôn ngữ với phát hiện ngôn ngữ tự động.
Trích xuất chi tiết chính
Tự động trích xuất các chi tiết quan trọng từ thẻ ID.
Tích hợp đầy đủ với các giải pháp Aspose
Tích hợp OCR liền mạch với các sản phẩm ASPOSE khác cho giải pháp Java toàn diện và hiệu quả.
Mẫu mã
Khám phá các mẫu mã để tìm hiểu cách tích hợp liền mạch API OCR vào các ứng dụng Java của bạn.
Cài đặt
Nhận biết văn bản trên hình ảnh được quét trong Java
Vượt qua thách thức của các ứng dụng OCR thiếu máy quét rộng rãi. API của chúng tôi tự hào có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ, xử lý các hình ảnh xoay vòng, sai lệch và ồn ào. Kết hợp với hỗ trợ cho tất cả các định dạng hình ảnh, nó đảm bảo nhận dạng đáng tin cậy ngay cả từ ảnh điện thoại thông minh. Hầu hết các xử lý trước và điều chỉnh hình ảnh đều được tự động hóa, chỉ cần sự can thiệp của bạn trong các trường hợp thách thức.
Áp dụng hiệu chỉnh hình ảnh tự động - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Trích xuất văn bản từ ảnh trong Java
Tích hợp phát hiện văn bản và nhận dạng trong các ứng dụng Java của bạn. Truy cập kết quả chính xác từ ảnh dễ dàng, tăng cường khả năng xử lý hình ảnh của bạn. Tăng khả năng xử lý hình ảnh, có được kết quả chính xác từ ảnh.
Phát hiện và nhận ra văn bản trên ảnh - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Tối ưu hóa tài nguyên trong Java
Nhận dạng nhân vật quang học đòi hỏi tài nguyên. API của chúng tôi cung cấp các cách linh hoạt để cân bằng bộ ba chất lượng giá thời gian cổ điển. Nó cho phép bạn hạn chế số lượng chủ đề được sử dụng bởi công cụ nhận dạng. Mặc dù điều chỉnh này có thể dẫn đến tốc độ nhận dạng chậm hơn, nhưng nó cho phép bạn phân bổ tài nguyên cho các tác vụ đồng thời như xử lý hình ảnh song song, hoạt động máy chủ web, quản lý cơ sở dữ liệu hoặc phân tích dữ liệu nền.
- Chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
- Chỉ định số lượng luồng được phân bổ để nhận dạng hoặc cho phép thư viện tự động mở rộng theo số lượng lõi của bộ xử lý.
- Giải phóng CPU bằng cách giảm tải các tính toán cho GPU.
Cân bằng tài nguyên UASAGE
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
Nhận dạng nhanh với thiết lập tối thiểu
Nếu hình ảnh của bạn là quét chất lượng cao mà không có độ lệch hoặc biến dạng, bạn có thể sử dụng chế độ nhận dạng nhanh nhất tiêu thụ các tài nguyên tối thiểu có thể bằng cách sử dụng:
Công nhận nhanh OCR - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});