Thành thạo OCR bằng Python: Được cung cấp bởi Aspose.OCR cho Python thông qua .NET
OCR: Chuyển đổi hình ảnh thành văn bản bằng Python
Thêm phòng trưng bày ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Tại sao chọn Aspose.OCR cho Python qua .NET?
Bắt đầu cuộc hành trình với Aspose.OCR cho Python thông qua .NET - API OCR linh hoạt và thân thiện với người dùng. Nhúng chức năng OCR vào các ứng dụng Python của bạn với ít hơn 5 dòng mã, loại bỏ nhu cầu về mạng thần kinh hoặc toán học phức tạp. Công cụ OCR mạnh mẽ của chúng tôi mang lại tốc độ và độ chính xác tuyệt vời, hỗ trợ hơn 130 ngôn ngữ, bao gồm chữ Latinh, Cyrillic, Ả Rập, Ba Tư, Ấn Độ và Trung Quốc. Cho dù đó là hình ảnh được quét, ảnh trên điện thoại thông minh, ảnh chụp màn hình hay tệp PDF được quét, đều thu được kết quả ở các định dạng trao đổi dữ liệu và tài liệu phổ biến. Tận dụng các bộ lọc tiền xử lý để xử lý hình ảnh bị xoay, lệch và nhiễu. Tối ưu hóa hiệu suất nhận dạng và tải hệ thống bằng cách giảm tải các tác vụ tiêu tốn nhiều tài nguyên cho phần phụ trợ .NET.
Làm chủ OCR hiệu quả và chính xác
Trải nghiệm tốc độ và độ chính xác tuyệt vời trong kết quả OCR với công nghệ Python và .NET tiên tiến.
Xuất sắc đa ngôn ngữ
Nhận dạng văn bản bằng hơn 130 ngôn ngữ, bao gồm các chữ viết Latinh, Cyrillic và Trung Quốc một cách dễ dàng và chính xác.
Xử lý hình ảnh có thể thích ứng
Xử lý hình ảnh dễ dàng từ nhiều nguồn khác nhau – máy quét, máy ảnh và điện thoại thông minh – bằng cách sử dụng Python và .NET.
Thành thạo ký tự tiếng Trung
Đạt được khả năng nhận dạng chính xác hơn 6.000 ký tự tiếng Trung, đảm bảo độ chính xác với Python và .NET.
Bảo toàn kiểu và định dạng phông chữ
Duy trì kiểu và định dạng phông chữ để thể hiện văn bản chính xác, nâng cao tính linh hoạt với Python và .NET.
Mẫu mã trực tiếp
Trải nghiệm sự đơn giản: Chuyển đổi hình ảnh thành văn bản chỉ bằng ba dòng mã Python!
* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Khám phá thêm ví dụ ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Chọn sở thích của bạn
Chọn thư viện phù hợp với nhu cầu của bạn. Khám phá các API có sẵn và khả năng của chúng để chọn giải pháp hiệu quả nhất.
Tính linh hoạt
Python via .NET
Tính đồng nhất
Python via Java
Hiệu suất
Python via C++
Trao quyền .NET cho Python ở mọi góc cạnh
Aspose.OCR cho Python thông qua .NET hoạt động liền mạch trên mọi nền tảng hỗ trợ .NET Framework 4.0 trở lên – có thể là máy cục bộ, web máy chủ hoặc đám mây.
Các định dạng tập tin được hỗ trợ
Aspose.OCR for Python via .NET có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR hàng loạt
- Multi-page PDF
- DjVu
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Cài đặt cho Python với phần phụ trợ .NET
Aspose.OCR dành cho Python qua .NET được phân phối dưới dạng gói Python với mức độ phụ thuộc tối thiểu hoặc dưới dạng tệp có thể tải xuống . Dễ dàng cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.
Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
OCR mạnh mẽ cho các ứng dụng Python
Thư viện của chúng tôi tích hợp dễ dàng, cho phép các ứng dụng Python chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.
Hơn 130 ngôn ngữ nhận dạng
API Python và .NET OCR của chúng tôi nhận dạng rất nhiều ngôn ngữ và tập lệnh viết phổ biến, bao gồm cả các ngôn ngữ hỗn hợp:
Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.
- Bảng chữ cái Latinh mở rộng: tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Indonesia, tiếng Bồ Đào Nha, tiếng Đức, tiếng Việt, tiếng Thổ Nhĩ Kỳ, tiếng Ý, tiếng Ba Lan và hơn 80 ngôn ngữ khác;
- Bảng chữ cái Cyrillic: tiếng Nga, tiếng Ukraina, tiếng Kazakhstan, tiếng Serbia, tiếng Belarus, tiếng Bungari;
- Tiếng Ả Rập, tiếng Ba Tư, tiếng Urdu;
- Chữ viết tiếng Trung và chữ Devanagari, bao gồm tiếng Hindi, tiếng Marathi, Bhojpuri và các chữ khác.
Bộ lọc xử lý mạnh mẽ
Độ chính xác và độ tin cậy của nhận dạng ký tự quang học phụ thuộc rất nhiều vào chất lượng của ảnh gốc. Aspose.OCR cho Python thông qua .NET cung cấp một số lượng lớn các bộ lọc xử lý hình ảnh thủ công và hoàn toàn tự động nhằm cải thiện hình ảnh trước khi nó được gửi đến công cụ OCR:
- Tự động làm thẳng hình ảnh được căn chỉnh một góc nhỏ so với phương ngang.
- Xoay thủ công các hình ảnh bị lệch nghiêm trọng.
- Tự động loại bỏ bụi bẩn, đốm, vết trầy xước, độ chói, độ dốc không mong muốn và tiếng ồn khác.
- Tự động điều chỉnh độ tương phản của hình ảnh.
- Tự động nâng cấp hoặc thay đổi kích thước hình ảnh theo cách thủ công.
- Chuyển đổi hình ảnh sang màu đen trắng hoặc thang độ xám.
- Đảo ngược màu sắc của hình ảnh để vùng sáng trông tối và vùng tối trông sáng.
- Tăng độ dày của ký tự trong hình ảnh.
- Làm mờ hình ảnh nhiễu trong khi vẫn giữ được các cạnh của chữ cái.
- Làm thẳng độ cong của trang và khắc phục hiện tượng méo ống kính máy ảnh cho ảnh trang.
Tối ưu hóa cho các loại tài liệu cụ thể
Aspose.OCR cho Python thông qua .NET cung cấp các mạng thần kinh được đào tạo đặc biệt để trích xuất văn bản từ một số loại hình ảnh nhất định với độ chính xác tối đa:
Trình kiểm tra chính tả tích hợp
Mặc dù Aspose.OCR cho Python qua .NET cung cấp độ chính xác nhận dạng cao, nhưng lỗi in, bụi bẩn hoặc phông chữ không chuẩn có thể khiến một số ký tự hoặc từ nhất định được nhận dạng không chính xác. Để cải thiện hơn nữa kết quả nhận dạng, bạn có thể bật trình kiểm tra chính tả, tính năng này sẽ tìm và tự động sửa lỗi chính tả dựa trên ngôn ngữ nhận dạng đã chọn.
Nếu văn bản được nhận dạng chứa thuật ngữ chuyên ngành, từ viết tắt và các từ khác không có trong từ điển chính tả thông thường, bạn có thể cung cấp danh sách từ của riêng mình.
Nhận dạng hàng loạt được đơn giản hóa
API Python OCR của chúng tôi giúp bạn không phải nhận dạng từng hình ảnh một. Sử dụng nhiều phương pháp xử lý hàng loạt khác nhau để nhận dạng nhiều hình ảnh trong một lệnh gọi:
- Nhận dạng các tệp PDF, TIFF và DjVu nhiều trang.
- Nhận dạng tất cả các tập tin trong một thư mục.
- Nhận dạng tất cả các tập tin trong một kho lưu trữ.
- Nhận dạng tất cả các tập tin từ một danh sách.
Học qua các ví dụ về Python
Aspose.OCR cho Python thông qua .NET cung cấp một loạt ví dụ được viết bằng Python, cho phép bạn nhanh chóng làm quen với các chức năng của nó và khả năng. Thu thập thông tin chi tiết để tạo các giải pháp phù hợp nhằm đáp ứng nhu cầu kinh doanh Python của bạn.
Tính năng và khả năng
Aspose.OCR for Python via .NET Khám phá các khả năng nâng cao của Aspose.OCR cho C++.
Ảnh OCR
Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức độ quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.
Nhận dạng URL
Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.
Nhận dạng hàng loạt
Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.
Tinh chỉnh nhận dạng
Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.
Công cụ kiểm tra chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.
So sánh văn bản hình ảnh
So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.
Mẫu mã Python
Đi sâu vào các mẫu mã để tích hợp liền mạch Aspose.OCR cho Python thông qua .NET vào các ứng dụng Python của bạn.
Thành thạo cài đặt bằng Python
Được phân phối dưới dạng Python Wheel hoặc gói có thể tải xuống độc lập, Aspose.OCR cho Python qua .NET được phân phối dễ dàng. Tích hợp vào dự án Python của bạn, trực tiếp từ Môi trường phát triển tích hợp Python (IDE) ưa thích của bạn, là một quá trình liền mạch. Chỉ cần cài đặt nó và bạn đã sẵn sàng tận dụng toàn bộ khả năng OCR, lưu kết quả nhận dạng ở nhiều định dạng khác nhau.
Sau khi cài đặt, bạn có thể nhanh chóng bắt đầu sử dụng Aspose.OCR cho Python qua .NET , mặc dù có những hạn chế nhất định. Giấy phép tạm thời dỡ bỏ tất cả các hạn chế đối với phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Python qua .NET ở giai đoạn sau.
Tải giấy phép
lic = License()
lic.set_license(self.licPath)
Nhận dạng văn bản trên Ảnh
Đọc văn bản từ bất kỳ nội dung nào trong Aspose.OCR cho Python qua .NET cũng dễ dàng như gọi một phương thức nhận dạng phổ quát ().
Chuyển đổi ảnh thành văn bản - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Bộ chuyển đổi phổ quát Python
API của chúng tôi đọc thành thạo mọi hình ảnh từ máy quét, máy ảnh hoặc điện thoại thông minh: tài liệu PDF, JPEG, PNG, TIFF, GIF, hình ảnh BMP và thậm chí cả tệp DjVu. Hỗ trợ đầy đủ cho các tài liệu PDF nhiều trang, hình ảnh TIFF và DjVu đảm bảo tính linh hoạt. Bạn cũng có thể cung cấp hình ảnh từ web thông qua URL.
Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tài liệu phổ biến: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.
Nhận dạng PDF và lưu kết quả sang các định dạng đầu ra khác nhau - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Tối ưu hóa tài nguyên trong Python
Nhận dạng ký tự quang học đòi hỏi tài nguyên. API của chúng tôi cung cấp những cách linh hoạt để cân bằng bộ ba chất lượng-giá-thời gian cổ điển:
- Chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
- Chỉ định số lượng luồng được phân bổ để nhận dạng hoặc cho phép thư viện tự động chia tỷ lệ theo số lõi bộ xử lý.
- Giải phóng CPU bằng cách giảm tải các phép tính cho phần phụ trợ .NET.
Nhận dạng nhanh - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Nhận biết dòng đơn
Nếu hình ảnh của bạn đã được cắt thành một dòng văn bản, nó có thể được nhận dạng ở chế độ nhanh nhất có thể mà không cần chỉnh sửa tự động, phát hiện cấu trúc nội dung và các bước tiêu tốn tài nguyên khác. Nó có thể tăng tốc độ OCR nhanh hơn tới 7 lần so với quá trình nhận dạng thông thường.
Nhận dạng một dòng văn bản trên hình ảnh - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)