OCR Xuất sắc với Aspose.OCR cho Python qua C++
Nhận dạng hình ảnh thành văn bản bằng Python OCR
Thêm phòng trưng bày >import asposeocr
settings = asposeocr.RecognitionSettings()
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = AsposeOCRRecognize(input_data, settings)
> pip install aspose-ocr-python-cpp
Tại sao chọn Aspose.OCR cho Python qua C++?
Nâng cao khả năng OCR của bạn với Aspose.OCR cho Python thông qua C++. Thư viện có nhiều tính năng này tích hợp liền mạch OCR vào các ứng dụng Python với mã tối thiểu. Trải nghiệm tốc độ và độ chính xác vượt trội, hỗ trợ hơn 130 ngôn ngữ, bao gồm chữ Latinh, Cyrillic, Ả Rập, Ba Tư, Ấn Độ và Trung Quốc. Nhận dạng nhiều loại hình ảnh, từ tài liệu được quét và ảnh trên điện thoại thông minh đến ảnh chụp màn hình và tệp PDF được quét. Các bộ lọc tiền xử lý nâng cao xử lý các thách thức như hình ảnh bị xoay, lệch và nhiễu, đảm bảo hiệu suất tối ưu bằng cách tận dụng khả năng xử lý GPU.
OCR nhanh và chính xác
Đạt được kết quả OCR nhanh chóng và chính xác bằng Python tiên tiến thông qua công nghệ C++.
Nhận dạng đa ngôn ngữ
Nhận dạng văn bản bằng hơn 130 ngôn ngữ, đảm bảo tính linh hoạt cho các ứng dụng Python thông qua tích hợp C++.
Hỗ trợ hình ảnh toàn diện
Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách dễ dàng bằng Python qua C++.
Nhận dạng ký tự tiếng Trung chính xác
Nhận dạng chính xác hơn 6.000 ký tự tiếng Trung trong các dự án Python của bạn thông qua C++.
Duy trì kiểu và định dạng phông chữ
Giữ nguyên kiểu phông chữ và định dạng để thể hiện chính xác văn bản được nhận dạng trong ứng dụng Python của bạn thông qua C++.
Mẫu mã trực tiếp
Bắt đầu nhận dạng văn bản từ hình ảnh chỉ bằng ba dòng mã. Trải nghiệm sự đơn giản!
* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Thêm ví dụ >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);
Chọn sở thích của bạn
Chọn thư viện phù hợp với nhu cầu của bạn. Khám phá các API có sẵn và khả năng của chúng để chọn giải pháp hiệu quả nhất.
Tính linh hoạt
Python via .NET
Tính đồng nhất
Python via Java
Hiệu suất
Python via C++
Tích hợp OCR cho các ứng dụng Python
Aspose.OCR cho Python thông qua C++ tích hợp liền mạch với mọi nền tảng hỗ trợ C++ - cho dù trên máy tính để bàn Windows, Windows Server, macOS, Linux , hoặc đám mây.
Các định dạng tập tin được hỗ trợ
Aspose.OCR for Python via C++ có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- BMP
OCR hàng loạt
- Multi-page PDF
- ZIP
- Folder
Kết quả công nhận
- Text
- Microsoft Word
- Microsoft Excel
- RTF
- JSON
- XML
Cài đặt dễ dàng cho Python qua C++
Aspose.OCR dành cho Python thông qua C++ được phân phối dưới dạng gói Python hoặc dưới dạng tệp có thể tải xuống với mức độ phụ thuộc tối thiểu. Dễ dàng cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.
Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
Tích hợp phụ trợ C++ cho các ứng dụng Python
Thư viện của chúng tôi tích hợp liền mạch với chương trình phụ trợ C++, cho phép các ứng dụng Python chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.
Hơn 130 ngôn ngữ nhận dạng
Hỗ trợ nhiều ngôn ngữ và chữ viết đa dạng, bao gồm cả các ngôn ngữ hỗn hợp:
Tối ưu hóa khả năng nhận dạng bằng cách cho phép thư viện phát hiện ngôn ngữ hoặc xác định ngôn ngữ đó để cải thiện hiệu suất.
- Bảng chữ cái Latinh mở rộng: tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Indonesia, tiếng Bồ Đào Nha, tiếng Đức, tiếng Việt, tiếng Thổ Nhĩ Kỳ, tiếng Ý, tiếng Ba Lan và hơn 80 ngôn ngữ khác;
- Bảng chữ cái Cyrillic: tiếng Nga, tiếng Ukraina, tiếng Kazakhstan, tiếng Serbia, tiếng Belarus, tiếng Bungari;
- Tiếng Ả Rập, tiếng Ba Tư, tiếng Urdu;
- Chữ viết tiếng Trung và chữ Devanagari, bao gồm tiếng Hindi, tiếng Marathi, Bhojpuri và các chữ khác.
Các tính năng chính
Aspose.OCR for Python via C++ Khám phá các khả năng nâng cao của Aspose.OCR cho Python thông qua C++.
Ảnh OCR
Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức độ quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.
Nhận dạng URL
Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.
Nhận dạng hàng loạt
Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.
Tinh chỉnh nhận dạng
Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.
Công cụ kiểm tra chính tả
Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.
Tìm văn bản trong hình ảnh
Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.
So sánh văn bản hình ảnh
So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.
Giới hạn phạm vi nhận dạng
Giới hạn bộ ký tự mà công cụ OCR sẽ tìm kiếm.
Phát hiện lỗi hình ảnh
Tự động tìm các khu vực hình ảnh có vấn đề.
Nhận biết khu vực
Chỉ tìm và đọc các vùng cụ thể của hình ảnh chứ không phải tất cả văn bản.
Mẫu mã Python
Khám phá các mẫu mã để tích hợp liền mạch Aspose.OCR cho Python thông qua C++ vào ứng dụng của bạn.
Cài đặt dễ dàng
Sau khi cài đặt, hãy bắt đầu ngay sử dụng Aspose.OCR cho Python qua C++, mặc dù có những hạn chế nhất định. Giấy phép tạm thời loại bỏ tất cả các hạn chế của phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Python qua C++ sau này.
Phát hiện vùng tài liệu
Bản quét hình ảnh hoặc ảnh chụp tài liệu văn bản thường bao gồm nhiều khối nội dung, bao gồm các đoạn văn bản, bảng biểu, hình minh họa, công thức, v.v. Việc nhận dạng thành công và chính xác các lĩnh vực quan tâm này trên một trang là rất quan trọng để OCR hiệu quả. Quá trình quan trọng này được gọi là phát hiện vùng tài liệu, liên quan đến việc xác định, tổ chức và phân loại các vùng nội dung riêng biệt.Aspose.OCR cung cấp một số thuật toán phát hiện vùng tài liệu, cho phép bạn chọn thuật toán phù hợp nhất với nội dung cụ thể của mình.
Thiết lập cho nhiều nội dung hình ảnh khác nhau - Python OCR
settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)
Các định dạng đầu ra khác nhau
OCR cho C++ có thể lưu kết quả nhận dạng ở nhiều định dạng để có thể chia sẻ, lưu trữ trong cơ sở dữ liệu, hiển thị hoặc phân tích: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML. {index-content-python-cpp.code_samples.item3.content2}
Lưu kết quả nhận dạng vào JSON - Python
recognize_result_txt
= asposeocr.AsposeOCRSerializeResult(
recognize_result,
asposeocr.ExportFormat.json)