API OCR nhanh và đáng tin cậy dựa trên Aspose.oc cho C ++
Hình ảnh để nhận dạng văn bản với Python OCR
Thêm giới thiệu >import asposeocr
settings = asposeocr.RecognitionSettings()
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = AsposeOCRRecognize(input_data, settings)
> pip install aspose-ocr-python-cpp
Tại sao chọn Aspose.oc cho Python qua C ++?
Tăng cường khả năng OCR của bạn với Aspose.oc cho Python thông qua C ++. Thư viện đóng gói tính năng này tích hợp liền mạch OCR vào các ứng dụng Python với mã tối thiểu. Trải nghiệm tốc độ và độ chính xác đặc biệt, hỗ trợ hơn 140 ngôn ngữ, bao gồm các kịch bản Latin, Cyrillic, Ả Rập, Ba Tư, chỉ định và Trung Quốc. Nhận ra một loạt các hình ảnh, từ các tài liệu được quét và ảnh điện thoại thông minh đến ảnh chụp màn hình và các tệp PDF được quét. Các bộ lọc tiền xử lý tiên tiến xử lý các thách thức như hình ảnh xoay, sai lệch và ồn ào, đảm bảo hiệu suất tối ưu bằng cách tận dụng xử lý GPU.

OCR nhanh và chính xác
Đạt được kết quả OCR nhanh chóng và chính xác với Python tiên tiến thông qua công nghệ C ++.
Nhận biết đa ngôn ngữ
Nhận biết văn bản bằng hơn 140 ngôn ngữ, đảm bảo tính linh hoạt cho các ứng dụng Python thông qua tích hợp C ++.
Hỗ trợ hình ảnh toàn diện
Xử lý một cách dễ dàng hình ảnh từ máy quét, máy ảnh và điện thoại thông minh với Python thông qua C ++.
Nhận dạng nhân vật Trung Quốc chính xác
Nhận ra chính xác hơn 6.000 ký tự Trung Quốc trong các dự án Python của bạn thông qua C ++.
Duy trì kiểu chữ và định dạng
Bảo tồn các kiểu phông chữ và định dạng để biểu diễn chính xác văn bản được công nhận trong các ứng dụng Python của bạn thông qua C ++.
Mẫu mã trực tiếp
Bắt đầu nhận dạng văn bản từ hình ảnh chỉ trong ba dòng mã. Trải nghiệm sự đơn giản!
* Bằng cách tải lên các tệp của bạn hoặc sử dụng dịch vụ mà bạn đồng ý với Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Nhiều ví dụ hơn >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);
Chọn sở thích của bạn
Chọn thư viện phù hợp cho nhu cầu của bạn. Khám phá API có sẵn và khả năng của chúng để chọn giải pháp hiệu quả nhất.
Tính linh hoạt
Python via .NET
Tính đồng nhất
Python via Java
Hiệu suất
Python via C++
Tích hợp OCR cho các ứng dụng Python
Aspose.ocr cho Python thông qua C ++ tích hợp liền mạch với bất kỳ nền tảng nào hỗ trợ C ++
Các định dạng tệp được hỗ trợ
Aspose.OCR for Python via C++ có thể làm việc với bất kỳ tệp Bạn có thể nhận được từ máy quét hoặc máy ảnh. Kết quả nhận dạng có thể được lưu, nhập vào cơ sở dữ liệu hoặc được phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- BMP
Lô OCR
- Multi-page PDF
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- RTF
- JSON
- XML
Cài đặt dễ dàng cho Python thông qua C ++
Aspose.oc cho Python qua C ++ được phân phối dưới dạng gói Python hoặc dưới dạng tệp có thể tải xuống với các phụ thuộc tối thiểu. Dễ dàng Cài đặt Nó vào dự án của bạn và bạn đã sẵn sàng nhận ra các văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở các định dạng khác nhau.
Yêu cầu giấy phép dùng thử để khởi động sự phát triển của một ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
Tích hợp phụ trợ C ++ cho các ứng dụng Python
Thư viện của chúng tôi tích hợp liền mạch với phụ trợ C ++, cho phép các ứng dụng Python chạy liền mạch trên bất kỳ nền tảng nào - Windows Desktop, Windows Server, MacOS, Linux và Cloud.
140 ngôn ngữ nhận dạng
Hỗ trợ cho các ngôn ngữ và tập lệnh khác nhau, bao gồm các ngôn ngữ hỗn hợp:
Tối ưu hóa nhận dạng bằng cách cho phép thư viện phát hiện ngôn ngữ hoặc xác định nó để cải thiện hiệu suất.
- ** Latin mở rộng ** Bảng chữ cái: Tiếng Anh, Tây Ban Nha, Pháp, Indonesia, Bồ Đào Nha, Đức, Việt Nam, Thổ Nhĩ Kỳ, Ý, Ba Lan, và hơn 80 người khác;
- ** Cyrillic ** Bảng chữ cái: Nga, Ukraine, Kazakh, Serbia, Belarusan, Bulgaria;
- Tiếng Ả Rập, Ba Tư, tiếng Urdu;
- Kịch bản Trung Quốc và Devanagari, bao gồm tiếng Hindi, Marathi, Bhojpuri và những người khác.
Các tính năng chính
Aspose.OCR for Python via C++ Khám phá các khả năng nâng cao của Aspose.oc cho Python thông qua C ++.
Ảnh OCR
Trích xuất văn bản từ ảnh điện thoại thông minh với độ chính xác cấp quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ lần quét thành một tài liệu có thể tìm kiếm đầy đủ và có thể lập chỉ mục.
Công nhận URL
Nhận ra một hình ảnh từ URL mà không tải xuống cục bộ.
Công nhận số lượng lớn
Đọc tất cả các hình ảnh từ các tài liệu, thư mục và tài liệu lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản trong tất cả các kiểu chữ và kiểu phổ biến.
Công nhận tinh chỉnh
Điều chỉnh mọi tham số OCR cho kết quả nhận dạng tốt nhất.
Checker chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp các hình ảnh.
So sánh văn bản hình ảnh
So sánh các văn bản trên hai hình ảnh, bất kể trường hợp và bố cục.
Giới hạn phạm vi nhận dạng
Giới hạn tập hợp các ký tự mà động cơ OCR sẽ tìm kiếm.
Phát hiện lỗi hình ảnh
Tự động tìm thấy các khu vực có khả năng có vấn đề của hình ảnh.
Công nhận các khu vực
Tìm và đọc các lĩnh vực cụ thể của một hình ảnh, không phải tất cả văn bản.
Mẫu mã Python
Khám phá các mẫu mã để tích hợp liền mạch Aspose.oc cho Python thông qua C ++ vào các ứng dụng của bạn.
Cài đặt dễ dàng
Phát hiện khu vực tài liệu
Quét hình ảnh hoặc hình ảnh của một tài liệu văn bản thường bao gồm nhiều khối nội dung, bao gồm các đoạn văn bản, bảng, hình minh họa, công thức, v.v. Nhận biết thành công và chính xác các lĩnh vực quan tâm này trên một trang là rất quan trọng đối với OCR hiệu quả. Quá trình then chốt này được gọi là phát hiện khu vực tài liệu, liên quan đến việc xác định, tổ chức và phân loại các vùng nội dung riêng biệt.Aspose.oc cung cấp một số thuật toán phát hiện khu vực tài liệu, cho phép bạn chọn một trong những hoạt động tốt nhất cho nội dung cụ thể của bạn.
Thiết lập nội dung hình ảnh đa dạng - Python OCR
settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)
Định dạng đầu ra khác nhau
OCR cho C ++ có thể lưu kết quả nhận dạng ở nhiều định dạng để chúng có thể được chia sẻ, lưu trữ trong cơ sở dữ liệu, hiển thị hoặc phân tích: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML. {index-content-python-cpp.code_samples.item3.content2}
Lưu kết quả nhận dạng cho JSON - Python
recognize_result_txt
= asposeocr.AsposeOCRSerializeResult(
recognize_result,
asposeocr.ExportFormat.json)