OCR for Java

OCR for C++

OCR for Python via .NET

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via Java

Chuyển đổi hình ảnh thành văn bản bằng API Python OCR qua Java

Mở khóa sức mạnh của OCR trong Python bằng cách sử dụng Aspose.oc giàu tính năng của chúng tôi cho Python thông qua Thư viện Java. Chuyển đổi hình ảnh và tệp PDF thành văn bản có thể chỉnh sửa một cách dễ dàng.

Tải xuống Sự thử nghiệm Mua

Xem những gì mới

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-java or
download

Tại sao Aspose.oc cho Python qua Java?

Aspose.oc cho Python thông qua Java tích hợp liền mạch các khả năng nhận dạng ký tự quang học mạnh mẽ (OCR) vào các máy tính xách tay và ứng dụng Python đa nền tảng của bạn. Với API trực quan và tốc độ cao của chúng tôi, bạn có thể dễ dàng trích xuất văn bản từ quét, ảnh chụp màn hình, liên kết web hoặc ảnh điện thoại thông minh, cung cấp kết quả sẵn sàng để hợp nhất, phân tích hoặc lưu trữ. Nhận biết hình ảnh được quét, ảnh điện thoại thông minh, ảnh chụp màn hình và PDF được quét, lưu kết quả ở các định dạng tài liệu phổ biến. Các bộ lọc xử lý trước tiên tiến xử lý hình ảnh xoay, lệch và ồn ào. Tối ưu hóa hiệu suất bằng cách giảm tải các tác vụ cho GPU.

OCR nhanh và chính xác

Đạt được kết quả OCR tốc độ cao và chính xác với Python tiên tiến của chúng tôi thông qua công nghệ Java.

Hỗ trợ đa ngôn ngữ

Nhận biết văn bản bằng hơn 140 ngôn ngữ, bao gồm Latin, Cyrillic, tiếng Ả Rập, tiếng Ba Tư, chỉ báo và kịch bản Trung Quốc, đảm bảo tính linh hoạt cho các ứng dụng Python của bạn thông qua Java.

Hỗ trợ hình ảnh linh hoạt

Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách liền mạch với Python qua Java.

Độ chính xác trong nhận dạng nhân vật Trung Quốc

Nhận ra hơn 6.000 ký tự Trung Quốc với độ chính xác trong các dự án Python của bạn thông qua Java.

Bảo tồn kiểu phông chữ và định dạng

Duy trì kiểu phông chữ và định dạng để thể hiện chính xác văn bản được công nhận trong các ứng dụng Python của bạn thông qua Java.

Mẫu mã trực tiếp

Bắt đầu nhận dạng văn bản từ hình ảnh chỉ trong ba dòng mã. Trải nghiệm sự đơn giản!

Sẵn sàng để nhận ra Sẵn sàng để nhận ra Thả một tệp ở đây hoặc nhấp để duyệt *

* Bằng cách tải lên các tệp của bạn hoặc sử dụng dịch vụ mà bạn đồng ý với Điều khoản sử dụng Và Chính sách bảo mật.

Kết quả công nhận

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Chọn sở thích của bạn

Chọn thư viện phù hợp cho nhu cầu của bạn. Khám phá API có sẵn và khả năng của chúng để chọn giải pháp hiệu quả nhất.

Python via .NET

Dễ dàng phát triển, dễ đọc và khả năng bảo trì của mã

Tự hào có nhiều tính năng nhất và nhận được các bản cập nhật thường xuyên nhất

Tốc độ tổng thể có thể chậm hơn một chút so với các nền tảng khác

Python via Java

Sử dụng cùng một thư viện trên bất kỳ nền tảng nào

Chạy liền mạch ứng dụng của bạn trên bất kỳ thiết bị nào

Yêu cầu Môi trường thời gian chạy Java (JRE) phiên bản 8 trở lên

Python via C++

Tốc độ nhanh nhất có thể bất kể nền tảng

Rất nhiều quyền kiểm soát đối với quản lý tài nguyên

Nhắm mục tiêu vào các nhà phát triển có kinh nghiệm

Khả năng tương thích phụ trợ Java

Được thiết kế như một mô -đun Python, thư viện của chúng tôi đảm bảo khả năng tương thích trên các hệ điều hành chính hỗ trợ Java - bao gồm Microsoft Windows, Linux và MacOS hoặc nền tảng đám mây. Điều này cho phép bạn phát triển các ứng dụng trên một nền tảng và chạy liền mạch chúng trên một nền tảng khác, loại bỏ sự cần thiết cho bất kỳ sửa đổi mã nào.

Các định dạng tệp được hỗ trợ

Aspose.OCR for Python via Java có thể làm việc với bất kỳ tệp Bạn có thể nhận được từ máy quét hoặc máy ảnh. Kết quả nhận dạng có thể được lưu, nhập vào cơ sở dữ liệu hoặc được phân tích trong thời gian thực.

Hình ảnh

PDF
JPEG
PNG
TIFF
GIF
Bitmap

Lô OCR

Multi-page PDF
ZIP
Folder

Kết quả công nhận

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Cài đặt dễ dàng cho Python qua Java

Aspose.oc cho Python qua java được phân phối dưới dạng gói python hoặc dưới dạng tệp có thể tải xuống với các phụ thuộc tối thiểu. Dễ dàng Cài đặt Nó vào dự án của bạn và bạn đã sẵn sàng nhận dạng các văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở các định dạng khác nhau.

Yêu cầu giấy phép dùng thử để khởi động sự phát triển của một ứng dụng OCR đầy đủ chức năng mà không có giới hạn.

OCR mạnh mẽ cho các ứng dụng Python

Thư viện của chúng tôi dễ dàng tích hợp, cho phép các ứng dụng Python chạy liền mạch trên bất kỳ nền tảng nào - máy tính để bàn Windows, Windows Server, MacOS, Linux và Cloud.

140 ngôn ngữ nhận dạng

API Python và Java OCR của chúng tôi nhận ra rất nhiều ngôn ngữ và các tập lệnh viết phổ biến, bao gồm các ngôn ngữ hỗn hợp:

Để lại phát hiện ngôn ngữ cho thư viện hoặc tự xác định ngôn ngữ để nâng cao hiệu suất và độ tin cậy nhận dạng.

** Latin mở rộng ** Bảng chữ cái: Tiếng Anh, Tây Ban Nha, Pháp, Indonesia, Bồ Đào Nha, Đức, Việt Nam, Thổ Nhĩ Kỳ, Ý, Ba Lan, và hơn 80 người khác;
** Cyrillic ** Bảng chữ cái: Nga, Ukraine, Kazakh, Serbia, Belarusan, Bulgaria;
Tiếng Ả Rập, Ba Tư, tiếng Urdu;
Kịch bản Trung Quốc và Devanagari, bao gồm tiếng Hindi, Marathi, Bhojpuri và những người khác.

Bộ lọc xử lý hình ảnh nâng cao

Độ chính xác của nhận dạng ký tự quang học phụ thuộc rất nhiều vào chất lượng của hình ảnh gốc. Aspose.oc cho Python qua Java cung cấp một loạt các bộ lọc xử lý hình ảnh tự động và thủ công để tối ưu hóa hình ảnh trước khi gửi đến động cơ OCR:

Tự động duỗi thẳng hình ảnh hơi nghiêng.
Sửa chữa thủ công vòng quay của hình ảnh sai lệch nghiêm trọng.
Tự động loại bỏ bụi bẩn, đốm, vết trầy xước, ánh sáng chói, độ dốc không mong muốn và các loại tiếng ồn khác.
Tự động điều chỉnh độ tương phản hình ảnh.
Tự động cao cấp hoặc thay đổi kích thước thủ công hình ảnh.
Chuyển đổi hình ảnh thành màu đen và trắng hoặc thang độ xám.
Đảo ngược màu hình ảnh, làm cho các khu vực ánh sáng xuất hiện các khu vực tối và tối xuất hiện sáng.
Tăng độ dày của các ký tự trong một hình ảnh.
Hình ảnh ồn ào trong khi bảo tồn các cạnh thư.
Làm thẳng trang sai và biến dạng ống kính camera chính xác trong ảnh trang.

API cụ thể cho các loại tài liệu khác nhau

Aspose.oc cho Python qua Java cung cấp các mạng lưới thần kinh được đào tạo đặc biệt để trích xuất văn bản từ một số loại hình ảnh với độ chính xác tối đa:

Quét hoặc chụp ảnh thẻ ID và hộ chiếu.
Biển số xe.
Hóa đơn.
Biên lai.

Checker chính tả tích hợp

Mặc dù Aspose.oc cho Python thông qua Java cung cấp độ chính xác nhận dạng cao, khiếm khuyết in, bụi bẩn hoặc phông chữ không chuẩn có thể khiến một số ký tự hoặc từ ngữ được nhận ra không chính xác. Để cải thiện hơn nữa kết quả nhận dạng, bạn có thể bật trình kiểm tra chính tả, tìm và tự động sửa lỗi chính tả dựa trên ngôn ngữ nhận dạng đã chọn.

Nếu văn bản được công nhận chứa thuật ngữ chuyên ngành, chữ viết tắt và các từ khác không có trong các từ điển chính tả thông thường, bạn có thể cung cấp danh sách từ của riêng mình.

Nhận dạng lô hiệu quả

API Python OCR của chúng tôi trao quyền cho bạn hợp lý hóa nhận dạng hình ảnh. Sử dụng các phương pháp xử lý lô đa năng để xử lý hiệu quả nhiều hình ảnh trong một cuộc gọi:

Nhận ra PDF nhiều trang, TIFF.
Xử lý tất cả các tập tin trong một thư mục.
Xử lý nhận dạng cho tất cả các tập tin trong một kho lưu trữ.
Nhận biết hình ảnh từ một danh sách được chỉ định.

Học thông qua các ví dụ Python

Khám phá một loạt các ví dụ python được thiết kế để giúp bạn nhanh chóng nắm bắt các chức năng và khả năng của giải pháp OCR của chúng tôi. Nhanh chóng đạt được cái nhìn sâu sắc về việc tạo các giải pháp tùy chỉnh đáp ứng các yêu cầu kinh doanh cụ thể của bạn.

Tính năng và khả năng

Aspose.OCR for Python via Java Khám phá các tính năng nâng cao của Aspose.oc cho Python

Ảnh OCR

Trích xuất văn bản từ ảnh điện thoại thông minh với độ chính xác cấp quét.

PDF có thể tìm kiếm

Chuyển đổi bất kỳ lần quét thành một tài liệu có thể tìm kiếm đầy đủ và có thể lập chỉ mục.

Công nhận URL

Nhận ra một hình ảnh từ URL mà không tải xuống cục bộ.

Công nhận số lượng lớn

Đọc tất cả các hình ảnh từ các tài liệu, thư mục và tài liệu lưu trữ nhiều trang.

Bất kỳ phông chữ và phong cách

Xác định và nhận dạng văn bản trong tất cả các kiểu chữ và kiểu phổ biến.

Công nhận tinh chỉnh

Điều chỉnh mọi tham số OCR cho kết quả nhận dạng tốt nhất.

Checker chính tả

Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.

Tìm văn bản trong hình ảnh

Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp các hình ảnh.

So sánh văn bản hình ảnh

So sánh các văn bản trên hai hình ảnh, bất kể trường hợp và bố cục.

Mẫu mã Python

Khám phá các mẫu mã để tích hợp liền mạch Aspose.oc cho Python thông qua Java vào các ứng dụng của bạn.

Cài đặt dễ dàng

Là một gói Python hoặc một tệp có thể tải xuống với các phụ thuộc tối thiểu, Aspose.ocr cho Python qua Java đảm bảo phân phối dễ dàng. Tích hợp nó vào dự án của bạn trực tiếp từ Python và bạn đã sẵn sàng tận dụng các khả năng OCR hoàn chỉnh, lưu kết quả nhận dạng ở các định dạng khác nhau. Giấy phép tạm thời loại bỏ tất cả các hạn chế phiên bản dùng thử trong 30 ngày. Sử dụng giai đoạn này để bắt đầu phát triển một ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.oc cho Python qua Java sau đó.

Giấy phép tải

lic = License()
lic.set_license(self.licPath)

Nhận dạng hình ảnh

Thách thức chính trong các ứng dụng OCR là sự khan hiếm của máy quét cho người dùng cuối. API của chúng tôi, được tích hợp liền mạch với Python thông qua Java, có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ xử lý các hình ảnh xoay vòng, lệch và ồn ào. Kết hợp với hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy, ngay cả từ ảnh điện thoại thông minh. Hầu hết các xử lý trước và điều chỉnh hình ảnh đều được tự động hóa, chỉ cần sự can thiệp của bạn trong các trường hợp thách thức.

Áp dụng hiệu chỉnh hình ảnh tự động - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

API của chúng tôi đã đọc bất kỳ hình ảnh nào từ máy quét, máy ảnh hoặc điện thoại thông minh: Tài liệu PDF, JPEG, PNG, TIFF, GIF, BMP. Hỗ trợ đầy đủ cho các tài liệu PDF nhiều trang, hình ảnh TIFF và DJVU đảm bảo tính linh hoạt. Bạn cũng có thể cung cấp một hình ảnh từ web thông qua URL.

Kết quả nhận dạng được trả về trong các định dạng tài liệu và trao đổi dữ liệu phổ biến: Văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.

Nhận biết PDF và lưu kết quả cho các định dạng đầu ra khác nhau - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Tối ưu hóa việc sử dụng tài nguyên

OCR cung cấp một thuật toán nhận dạng đặc biệt để trích xuất nội dung từ hình ảnh với văn bản thưa thớt và nền nhiễu/màu. Phương pháp này cải thiện đáng kể độ chính xác của OCR trong các trường hợp kinh doanh sau:

Đọc văn bản từ ảnh đường phố.
Phân khúc và xác định các biển báo đường và bảng hiệu trong hình ảnh đường phố.
Xác định vị trí thẻ giá và giải thích văn bản trích xuất là giá.
Tìm và tổng hợp các khu vực quan tâm trên nhãn thực phẩm, chẳng hạn như thông tin dinh dưỡng hoặc danh sách thành phần.
Xác định và phân tích biển số xe.
Trích xuất văn bản từ menu và danh mục.

Khu vực mở OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Trích xuất văn bản từ ảnh đường phố

OCR cho Python cung cấp một thuật toán nhận dạng đặc biệt trích xuất văn bản từ các tấm giấy phép xe, bao gồm cả ảnh tối và mờ. Văn bản kết quả sau đó có thể được lưu tự động vào cơ sở dữ liệu hoặc tự động được xác minh.

Nhận biết số xe - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)