Chuyển đổi hình ảnh thành văn bản bằng API Python OCR qua Java
Nhận biết văn bản trong hình ảnh với Python
Thêm giới thiệu ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Tại sao Aspose.oc cho Python qua Java?
Aspose.oc cho Python thông qua Java tích hợp liền mạch các khả năng nhận dạng ký tự quang học mạnh mẽ (OCR) vào các máy tính xách tay và ứng dụng Python đa nền tảng của bạn. Với API trực quan và tốc độ cao của chúng tôi, bạn có thể dễ dàng trích xuất văn bản từ quét, ảnh chụp màn hình, liên kết web hoặc ảnh điện thoại thông minh, cung cấp kết quả sẵn sàng để hợp nhất, phân tích hoặc lưu trữ. Nhận biết hình ảnh được quét, ảnh điện thoại thông minh, ảnh chụp màn hình và PDF được quét, lưu kết quả ở các định dạng tài liệu phổ biến. Các bộ lọc xử lý trước tiên tiến xử lý hình ảnh xoay, lệch và ồn ào. Tối ưu hóa hiệu suất bằng cách giảm tải các tác vụ cho GPU.

OCR nhanh và chính xác
Đạt được kết quả OCR tốc độ cao và chính xác với Python tiên tiến của chúng tôi thông qua công nghệ Java.
Hỗ trợ đa ngôn ngữ
Nhận biết văn bản bằng hơn 140 ngôn ngữ, bao gồm Latin, Cyrillic, tiếng Ả Rập, tiếng Ba Tư, chỉ báo và kịch bản Trung Quốc, đảm bảo tính linh hoạt cho các ứng dụng Python của bạn thông qua Java.
Hỗ trợ hình ảnh linh hoạt
Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách liền mạch với Python qua Java.
Độ chính xác trong nhận dạng nhân vật Trung Quốc
Nhận ra hơn 6.000 ký tự Trung Quốc với độ chính xác trong các dự án Python của bạn thông qua Java.
Bảo tồn kiểu phông chữ và định dạng
Duy trì kiểu phông chữ và định dạng để thể hiện chính xác văn bản được công nhận trong các ứng dụng Python của bạn thông qua Java.
Mẫu mã trực tiếp
Bắt đầu nhận dạng văn bản từ hình ảnh chỉ trong ba dòng mã. Trải nghiệm sự đơn giản!
* Bằng cách tải lên các tệp của bạn hoặc sử dụng dịch vụ mà bạn đồng ý với Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Nhiều ví dụ hơn ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Chọn sở thích của bạn
Chọn thư viện phù hợp cho nhu cầu của bạn. Khám phá API có sẵn và khả năng của chúng để chọn giải pháp hiệu quả nhất.
Tính linh hoạt
Python via .NET
Tính đồng nhất
Python via Java
Hiệu suất
Python via C++
Khả năng tương thích phụ trợ Java
Được thiết kế như một mô -đun Python, thư viện của chúng tôi đảm bảo khả năng tương thích trên các hệ điều hành chính hỗ trợ Java - bao gồm Microsoft Windows, Linux và MacOS hoặc nền tảng đám mây. Điều này cho phép bạn phát triển các ứng dụng trên một nền tảng và chạy liền mạch chúng trên một nền tảng khác, loại bỏ sự cần thiết cho bất kỳ sửa đổi mã nào.
Các định dạng tệp được hỗ trợ
Aspose.OCR for Python via Java có thể làm việc với bất kỳ tệp Bạn có thể nhận được từ máy quét hoặc máy ảnh. Kết quả nhận dạng có thể được lưu, nhập vào cơ sở dữ liệu hoặc được phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Lô OCR
- Multi-page PDF
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Cài đặt dễ dàng cho Python qua Java
Aspose.oc cho Python qua java được phân phối dưới dạng gói python hoặc dưới dạng tệp có thể tải xuống với các phụ thuộc tối thiểu. Dễ dàng Cài đặt Nó vào dự án của bạn và bạn đã sẵn sàng nhận dạng các văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở các định dạng khác nhau.
Yêu cầu giấy phép dùng thử để khởi động sự phát triển của một ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
OCR mạnh mẽ cho các ứng dụng Python
Thư viện của chúng tôi dễ dàng tích hợp, cho phép các ứng dụng Python chạy liền mạch trên bất kỳ nền tảng nào - máy tính để bàn Windows, Windows Server, MacOS, Linux và Cloud.
140 ngôn ngữ nhận dạng
API Python và Java OCR của chúng tôi nhận ra rất nhiều ngôn ngữ và các tập lệnh viết phổ biến, bao gồm các ngôn ngữ hỗn hợp:
Để lại phát hiện ngôn ngữ cho thư viện hoặc tự xác định ngôn ngữ để nâng cao hiệu suất và độ tin cậy nhận dạng.
- ** Latin mở rộng ** Bảng chữ cái: Tiếng Anh, Tây Ban Nha, Pháp, Indonesia, Bồ Đào Nha, Đức, Việt Nam, Thổ Nhĩ Kỳ, Ý, Ba Lan, và hơn 80 người khác;
- ** Cyrillic ** Bảng chữ cái: Nga, Ukraine, Kazakh, Serbia, Belarusan, Bulgaria;
- Tiếng Ả Rập, Ba Tư, tiếng Urdu;
- Kịch bản Trung Quốc và Devanagari, bao gồm tiếng Hindi, Marathi, Bhojpuri và những người khác.
Bộ lọc xử lý hình ảnh nâng cao
Độ chính xác của nhận dạng ký tự quang học phụ thuộc rất nhiều vào chất lượng của hình ảnh gốc. Aspose.oc cho Python qua Java cung cấp một loạt các bộ lọc xử lý hình ảnh tự động và thủ công để tối ưu hóa hình ảnh trước khi gửi đến động cơ OCR:
- Tự động duỗi thẳng hình ảnh hơi nghiêng.
- Sửa chữa thủ công vòng quay của hình ảnh sai lệch nghiêm trọng.
- Tự động loại bỏ bụi bẩn, đốm, vết trầy xước, ánh sáng chói, độ dốc không mong muốn và các loại tiếng ồn khác.
- Tự động điều chỉnh độ tương phản hình ảnh.
- Tự động cao cấp hoặc thay đổi kích thước thủ công hình ảnh.
- Chuyển đổi hình ảnh thành màu đen và trắng hoặc thang độ xám.
- Đảo ngược màu hình ảnh, làm cho các khu vực ánh sáng xuất hiện các khu vực tối và tối xuất hiện sáng.
- Tăng độ dày của các ký tự trong một hình ảnh.
- Hình ảnh ồn ào trong khi bảo tồn các cạnh thư.
- Làm thẳng trang sai và biến dạng ống kính camera chính xác trong ảnh trang.
API cụ thể cho các loại tài liệu khác nhau
Aspose.oc cho Python qua Java cung cấp các mạng lưới thần kinh được đào tạo đặc biệt để trích xuất văn bản từ một số loại hình ảnh với độ chính xác tối đa:
- Quét hoặc chụp ảnh thẻ ID và hộ chiếu.
- Biển số xe.
- Hóa đơn.
- Biên lai.
Checker chính tả tích hợp
Mặc dù Aspose.oc cho Python thông qua Java cung cấp độ chính xác nhận dạng cao, khiếm khuyết in, bụi bẩn hoặc phông chữ không chuẩn có thể khiến một số ký tự hoặc từ ngữ được nhận ra không chính xác. Để cải thiện hơn nữa kết quả nhận dạng, bạn có thể bật trình kiểm tra chính tả, tìm và tự động sửa lỗi chính tả dựa trên ngôn ngữ nhận dạng đã chọn.
Nếu văn bản được công nhận chứa thuật ngữ chuyên ngành, chữ viết tắt và các từ khác không có trong các từ điển chính tả thông thường, bạn có thể cung cấp danh sách từ của riêng mình.
Nhận dạng lô hiệu quả
API Python OCR của chúng tôi trao quyền cho bạn hợp lý hóa nhận dạng hình ảnh. Sử dụng các phương pháp xử lý lô đa năng để xử lý hiệu quả nhiều hình ảnh trong một cuộc gọi:
- Nhận ra PDF nhiều trang, TIFF.
- Xử lý tất cả các tập tin trong một thư mục.
- Xử lý nhận dạng cho tất cả các tập tin trong một kho lưu trữ.
- Nhận biết hình ảnh từ một danh sách được chỉ định.
Học thông qua các ví dụ Python
Khám phá một loạt các ví dụ python được thiết kế để giúp bạn nhanh chóng nắm bắt các chức năng và khả năng của giải pháp OCR của chúng tôi. Nhanh chóng đạt được cái nhìn sâu sắc về việc tạo các giải pháp tùy chỉnh đáp ứng các yêu cầu kinh doanh cụ thể của bạn.
Tính năng và khả năng
Aspose.OCR for Python via Java Khám phá các tính năng nâng cao của Aspose.oc cho Python
Ảnh OCR
Trích xuất văn bản từ ảnh điện thoại thông minh với độ chính xác cấp quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ lần quét thành một tài liệu có thể tìm kiếm đầy đủ và có thể lập chỉ mục.
Công nhận URL
Nhận ra một hình ảnh từ URL mà không tải xuống cục bộ.
Công nhận số lượng lớn
Đọc tất cả các hình ảnh từ các tài liệu, thư mục và tài liệu lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản trong tất cả các kiểu chữ và kiểu phổ biến.
Công nhận tinh chỉnh
Điều chỉnh mọi tham số OCR cho kết quả nhận dạng tốt nhất.
Checker chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp các hình ảnh.
So sánh văn bản hình ảnh
So sánh các văn bản trên hai hình ảnh, bất kể trường hợp và bố cục.
Mẫu mã Python
Khám phá các mẫu mã để tích hợp liền mạch Aspose.oc cho Python thông qua Java vào các ứng dụng của bạn.
Cài đặt dễ dàng
Là một gói Python hoặc một tệp có thể tải xuống với các phụ thuộc tối thiểu, Aspose.ocr cho Python qua Java đảm bảo phân phối dễ dàng. Tích hợp nó vào dự án của bạn trực tiếp từ Python và bạn đã sẵn sàng tận dụng các khả năng OCR hoàn chỉnh, lưu kết quả nhận dạng ở các định dạng khác nhau. Giấy phép tạm thời loại bỏ tất cả các hạn chế phiên bản dùng thử trong 30 ngày. Sử dụng giai đoạn này để bắt đầu phát triển một ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.oc cho Python qua Java sau đó.
Giấy phép tải
lic = License()
lic.set_license(self.licPath)
Nhận dạng hình ảnh
Thách thức chính trong các ứng dụng OCR là sự khan hiếm của máy quét cho người dùng cuối. API của chúng tôi, được tích hợp liền mạch với Python thông qua Java, có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ xử lý các hình ảnh xoay vòng, lệch và ồn ào. Kết hợp với hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy, ngay cả từ ảnh điện thoại thông minh. Hầu hết các xử lý trước và điều chỉnh hình ảnh đều được tự động hóa, chỉ cần sự can thiệp của bạn trong các trường hợp thách thức.
Áp dụng hiệu chỉnh hình ảnh tự động - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
API của chúng tôi đã đọc bất kỳ hình ảnh nào từ máy quét, máy ảnh hoặc điện thoại thông minh: Tài liệu PDF, JPEG, PNG, TIFF, GIF, BMP. Hỗ trợ đầy đủ cho các tài liệu PDF nhiều trang, hình ảnh TIFF và DJVU đảm bảo tính linh hoạt. Bạn cũng có thể cung cấp một hình ảnh từ web thông qua URL.
Kết quả nhận dạng được trả về trong các định dạng tài liệu và trao đổi dữ liệu phổ biến: Văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.
Nhận biết PDF và lưu kết quả cho các định dạng đầu ra khác nhau - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Tối ưu hóa việc sử dụng tài nguyên
OCR cung cấp một thuật toán nhận dạng đặc biệt để trích xuất nội dung từ hình ảnh với văn bản thưa thớt và nền nhiễu/màu. Phương pháp này cải thiện đáng kể độ chính xác của OCR trong các trường hợp kinh doanh sau:
- Đọc văn bản từ ảnh đường phố.
- Phân khúc và xác định các biển báo đường và bảng hiệu trong hình ảnh đường phố.
- Xác định vị trí thẻ giá và giải thích văn bản trích xuất là giá.
- Tìm và tổng hợp các khu vực quan tâm trên nhãn thực phẩm, chẳng hạn như thông tin dinh dưỡng hoặc danh sách thành phần.
- Xác định và phân tích biển số xe.
- Trích xuất văn bản từ menu và danh mục.
Khu vực mở OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Trích xuất văn bản từ ảnh đường phố
OCR cho Python cung cấp một thuật toán nhận dạng đặc biệt trích xuất văn bản từ các tấm giấy phép xe, bao gồm cả ảnh tối và mờ. Văn bản kết quả sau đó có thể được lưu tự động vào cơ sở dữ liệu hoặc tự động được xác minh.
Nhận biết số xe - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)