Thư viện Python OCR
Chuyển hình ảnh thành văn bản bằng Python OCR
Thêm phòng trưng bày ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Tại sao Aspose.OCR cho Python qua .NET?
Bắt đầu cuộc hành trình với Aspose OCR cho Python thông qua .NET - API OCR linh hoạt và thân thiện với người dùng. Nhúng chức năng OCR vào các ứng dụng Python của bạn với ít hơn 5 dòng mã, loại bỏ nhu cầu về mạng thần kinh hoặc toán học phức tạp. Công cụ OCR mạnh mẽ của chúng tôi mang lại tốc độ và độ chính xác vô song, hỗ trợ hơn 130 ngôn ngữ, bao gồm tiếng Anh, tiếng Cyrillic, tiếng Ả Rập, tiếng Ba Tư, tiếng Hindi, tiếng Trung, tiếng Nhật, tiếng Hàn, tiếng Tamil và nhiều ngôn ngữ khác. Cho dù đó là hình ảnh được quét, ảnh trên điện thoại thông minh, ảnh chụp màn hình hay tệp PDF được quét, đều thu được kết quả ở các định dạng trao đổi dữ liệu và tài liệu phổ biến. Tận dụng các bộ lọc tiền xử lý để xử lý hình ảnh bị xoay, lệch và nhiễu.
OCR hiệu quả và chính xác
Trải nghiệm tốc độ và độ chính xác tuyệt vời trong kết quả OCR với công nghệ Python tiên tiến.
Đa ngôn ngữ
Nhận dạng văn bản bằng hơn 140 ngôn ngữ: tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha, tiếng Nga, tiếng Trung, tiếng Hindi, tiếng Nhật, tiếng Hàn, tiếng Tamil, tiếng Ả Rập, tiếng Ba Tư, v.v.
Phổ quát
Xử lý hình ảnh từ nhiều nguồn khác nhau – máy quét, máy ảnh và điện thoại thông minh – bằng Python một cách dễ dàng.
Ngôn ngữ châu Á
Đạt được sự nhận dạng chính xác các chữ viết tiếng Trung, tiếng Ả Rập, Devanagari và Dravidian, cũng như các văn bản ngôn ngữ hỗn hợp.
Giữ nguyên bố cục
Duy trì định dạng nguồn để thể hiện văn bản chính xác và nhận dạng bảng.
Mẫu mã trực tiếp
Chuyển đổi hình ảnh thành văn bản chỉ bằng BA dòng mã Python. Hãy cố gắng cho chính mình!
* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Khám phá thêm ví dụ ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Chọn sở thích của bạn
Chọn thư viện phù hợp với nhu cầu của bạn. Khám phá các API có sẵn và khả năng của chúng để chọn giải pháp hiệu quả nhất.
Tính linh hoạt
Python via .NET
Tính đồng nhất
Python via Java
Hiệu suất
Python via C++
Chạy khắp mọi nơi
Bất kể tên là gì, Aspose.OCR cho Python qua .NET không yêu cầu cài đặt .NET trên nền tảng đích. Gói cài đặt đã đi kèm với tất cả các thành phần cần thiết và có thể hoạt động liền mạch trên mọi nền tảng – có thể là máy cục bộ, máy chủ web hoặc đám mây.
Các định dạng tập tin được hỗ trợ
Aspose.OCR for Python via .NET có thể làm việc với bất kỳ [tập tin]nào( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích theo thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR hàng loạt
- Multi-page PDF
- DjVu
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Cài đặt
Aspose.OCR cho Python qua .NET được phân phối dưới dạng gói Python với mức độ phụ thuộc tối thiểu hoặc dưới dạng tệp có thể tải xuống hoặc [gói PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Dễ dàng cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng hơn 140 ngôn ngữ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.
Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
OCR dưới Python
Thư viện của chúng tôi tích hợp dễ dàng, cho phép các ứng dụng Python chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.
Hơn 140 ngôn ngữ nhận dạng
Thư viện Java OCR của chúng tôi là một giải pháp phổ quát để xử lý tài liệu, trích xuất dữ liệu và số hóa nội dung trên quy mô toàn cầu. Với sự hỗ trợ cho nhiều loại chữ viết ở Châu Âu, Trung Đông và Châu Á, nó có thể thích ứng tốt với mọi quốc gia và doanh nghiệp.
Aspose OCR for Java nhận dạng văn bản trong các tài liệu đa ngôn ngữ, chẳng hạn như tiếng Trung/tiếng Anh, tiếng Ả Rập/tiếng Pháp hoặc tiếng Cyrillic/tiếng Anh. Các ngôn ngữ sau được hỗ trợ:
- Tiếng Latin mở rộng: tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Indonesia, tiếng Bồ Đào Nha, tiếng Đức, tiếng Việt, tiếng Thổ Nhĩ Kỳ, tiếng Ý, tiếng Ba Lan và hơn 80 ngôn ngữ khác;
- Bảng chữ cái Cyrillic: tiếng Nga, tiếng Ukraina, tiếng Kazakh, tiếng Bungari, bao gồm các văn bản hỗn hợp tiếng Anh/Cyrillic;
- Tiếng Ả Rập, tiếng Ba Tư, tiếng Urdu, bao gồm cả văn bản pha trộn với tiếng Anh;
- Các ngôn ngữ Trung Quốc, Hàn Quốc, Nhật Bản, Devanagari và Dravidian, bao gồm tiếng Hindi, tiếng Tamil, tiếng Marathi và các ngôn ngữ khác. Văn bản ngôn ngữ hỗn hợp cũng được hỗ trợ.
Bộ lọc xử lý mạnh mẽ
Độ chính xác và độ tin cậy của nhận dạng ký tự quang học phụ thuộc rất nhiều vào chất lượng của ảnh gốc. Aspose OCR cho Python thông qua .NET cung cấp một số lượng lớn các bộ lọc xử lý hình ảnh thủ công và hoàn toàn tự động nhằm cải thiện hình ảnh trước khi nó được gửi đến công cụ OCR:
- Tự động xoay hình ảnh lộn ngược và xoay.
- Phát hiện hình ảnh đảo ngược và trích xuất văn bản trắng đen.
- Tự động loại bỏ bụi bẩn, đốm, vết trầy xước, độ chói, độ dốc không mong muốn và tiếng ồn khác.
- Tự động điều chỉnh độ tương phản của hình ảnh.
- Tự động nâng cấp hoặc thay đổi kích thước hình ảnh theo cách thủ công.
- Chuyển đổi hình ảnh sang màu đen trắng hoặc thang độ xám.
- Tìm các vùng hình ảnh có khả năng có vấn đề và trả về thông tin về loại lỗi cũng như tọa độ của nó.
- Tăng độ dày của ký tự trong ảnh.
- Làm mờ hình ảnh nhiễu trong khi vẫn giữ được các cạnh của chữ cái.
- Làm thẳng độ cong của trang và khắc phục hiện tượng méo ống kính máy ảnh cho ảnh trang.
Tối ưu hóa cho các loại tài liệu cụ thể
Aspose OCR cho Python thông qua .NET cung cấp các mạng thần kinh được đào tạo đặc biệt để trích xuất văn bản từ một số loại hình ảnh nhất định với độ chính xác tối đa:
Trình kiểm tra chính tả tích hợp
Mặc dù thư viện Python OCR của chúng tôi cung cấp độ chính xác nhận dạng cao nhưng lỗi in, bụi bẩn hoặc phông chữ không chuẩn có thể khiến một số ký tự hoặc từ nhất định được nhận dạng không chính xác. Để cải thiện hơn nữa kết quả nhận dạng, bạn có thể bật trình kiểm tra chính tả, tính năng này sẽ tìm và tự động sửa lỗi chính tả dựa trên ngôn ngữ nhận dạng đã chọn.
Nếu văn bản được nhận dạng chứa thuật ngữ chuyên ngành, từ viết tắt và các từ khác không có trong từ điển chính tả thông thường, bạn có thể cung cấp danh sách từ của riêng mình.
Nhận dạng hàng loạt
API Python OCR của chúng tôi giúp bạn không phải nhận dạng từng hình ảnh một. Sử dụng nhiều phương pháp xử lý hàng loạt khác nhau để nhận dạng nhiều hình ảnh trong một lệnh gọi:
- Nhận dạng các tệp PDF, TIFF và DjVu nhiều trang.
- Nhận dạng tất cả các tập tin trong một thư mục.
- Nhận dạng tất cả các tập tin trong một kho lưu trữ.
- Nhận dạng tất cả các tập tin từ một danh sách.
Học theo mẫu
OCR dành cho Python cung cấp một loạt ví dụ được viết bằng Python, cho phép bạn nhanh chóng làm quen với các chức năng và khả năng của nó. Nhận thông tin chi tiết để tạo các giải pháp phù hợp nhằm đáp ứng nhu cầu kinh doanh Python của bạn.
Tính năng và khả năng
Aspose.OCR for Python via .NET giải quyết nhiệm vụ của bạn nhanh chóng và dễ dàng.
Ảnh OCR
Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm, lập chỉ mục và chỉnh sửa đầy đủ.
Nhận dạng URL
Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.
Nhận dạng hàng loạt
Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.
Tinh chỉnh nhận dạng
Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.
Trình kiểm tra chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.
So sánh văn bản hình ảnh
So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.
Mẫu mã Python
Đi sâu vào các mẫu mã để tích hợp liền mạch OCR vào các ứng dụng Python của bạn.
Cài đặt
Được phân phối dưới dạng Python Wheel hoặc gói có thể tải xuống độc lập, Aspose.OCR cho Python qua .NET được phân phối dễ dàng. Tích hợp vào dự án Python của bạn, trực tiếp từ Môi trường phát triển tích hợp Python (IDE) ưa thích của bạn, là một quá trình liền mạch. Chỉ cần cài đặt nó và bạn đã sẵn sàng tận dụng toàn bộ khả năng OCR, lưu kết quả nhận dạng ở nhiều định dạng khác nhau.
Sau khi cài đặt, bạn có thể nhanh chóng bắt đầu sử dụng Aspose.OCR cho Python qua .NET , mặc dù có những hạn chế nhất định. Giấy phép tạm thời dỡ bỏ tất cả các hạn chế về phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Python qua .NET ở giai đoạn sau.
Tải giấy phép
lic = License()
lic.set_license(self.licPath)
Nhận dạng văn bản trên Ảnh
Đọc văn bản từ bất kỳ nội dung nào trong Aspose OCR cho Python cũng dễ dàng như gọi một phương thức nhận dạng chung.
Chuyển đổi ảnh thành văn bản - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Bộ chuyển đổi phổ quát Python
API của chúng tôi đọc thành thạo mọi hình ảnh từ máy quét, máy ảnh hoặc điện thoại thông minh: tài liệu PDF, JPEG, PNG, TIFF, GIF, hình ảnh BMP và thậm chí cả tệp DjVu. Hỗ trợ đầy đủ cho các tài liệu PDF nhiều trang, hình ảnh TIFF và DjVu đảm bảo tính linh hoạt. Bạn cũng có thể cung cấp hình ảnh từ web thông qua URL.
Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tài liệu phổ biến: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.
Nhận dạng PDF và lưu kết quả sang các định dạng đầu ra khác nhau - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Tối ưu hóa tài nguyên trong Python
Nhận dạng ký tự quang học đòi hỏi tài nguyên. API của chúng tôi cung cấp những cách linh hoạt để cân bằng bộ ba chất lượng-giá-thời gian cổ điển:
- Chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
- Chỉ định số lượng luồng được phân bổ để nhận dạng hoặc cho phép thư viện tự động chia tỷ lệ theo số lõi bộ xử lý.
- Giải phóng CPU bằng cách giảm tải các phép tính cho phần phụ trợ .NET.
Nhận dạng nhanh - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Nhận biết dòng đơn
Nếu hình ảnh của bạn đã được cắt thành một dòng văn bản, nó có thể được nhận dạng ở chế độ nhanh nhất có thể mà không cần chỉnh sửa tự động, phát hiện cấu trúc nội dung và các bước tiêu tốn tài nguyên khác. Nó có thể tăng tốc độ OCR nhanh hơn tới 7 lần so với quá trình nhận dạng thông thường.
Nhận dạng một dòng văn bản trên hình ảnh - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)