Tại sao chọn Aspose.OCR cho Python qua C++?

Nâng cao khả năng OCR của bạn với Aspose.OCR cho Python thông qua C++. Thư viện có nhiều tính năng này tích hợp liền mạch OCR vào các ứng dụng Python với mã tối thiểu. Trải nghiệm tốc độ và độ chính xác vượt trội, hỗ trợ 28 ngôn ngữ, bao gồm chữ Latinh, Cyrillic và tiếng Trung. Nhận dạng nhiều loại hình ảnh, từ tài liệu được quét và ảnh trên điện thoại thông minh đến ảnh chụp màn hình và tệp PDF được quét. Các bộ lọc tiền xử lý nâng cao xử lý các thách thức như hình ảnh bị xoay, lệch và nhiễu, đảm bảo hiệu suất tối ưu bằng cách tận dụng khả năng xử lý GPU.

Illustration ocr

OCR nhanh và chính xác

Đạt được kết quả OCR nhanh chóng và chính xác bằng Python tiên tiến thông qua công nghệ C++.

Nhận dạng đa ngôn ngữ

Nhận dạng văn bản bằng 28 ngôn ngữ, đảm bảo tính linh hoạt cho các ứng dụng Python thông qua tích hợp C++.

Hỗ trợ hình ảnh toàn diện

Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách dễ dàng bằng Python qua C++.

Nhận dạng ký tự tiếng Trung chính xác

Nhận dạng chính xác hơn 6.000 ký tự tiếng Trung trong các dự án Python của bạn thông qua C++.

Duy trì kiểu và định dạng phông chữ

Giữ nguyên kiểu phông chữ và định dạng để thể hiện chính xác văn bản được nhận dạng trong ứng dụng Python của bạn thông qua C++.

Mẫu mã trực tiếp

Bắt đầu nhận dạng văn bản từ hình ảnh chỉ bằng ba dòng mã. Trải nghiệm sự đơn giản!

Sẵn sàng công nhận Sẵn sàng công nhận Thả một tập tin ở đây hoặc bấm vào để duyệt *

* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụngChính sách bảo mật.

Kết quả công nhận
 

Chuyển đổi hình ảnh thành văn bản

Thêm ví dụ >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);

Tích hợp OCR cho các ứng dụng Python

Aspose.OCR cho Python thông qua C++ tích hợp liền mạch với mọi nền tảng hỗ trợ C++ - cho dù trên máy tính để bàn Windows, Windows Server, macOS, Linux , hoặc đám mây.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Các định dạng tập tin được hỗ trợ

Aspose.OCR for Python via C++ có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.

Hình ảnh

  • JPEG
  • PNG
  • TIFF
  • BMP

OCR hàng loạt

  • Multi-page PDF
  • ZIP
  • Folder

Kết quả công nhận

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

Cài đặt dễ dàng cho Python qua C++

Aspose.OCR dành cho Python thông qua C++ được phân phối dưới dạng gói Python hoặc dưới dạng tệp có thể tải xuống với mức độ phụ thuộc tối thiểu. Dễ dàng cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.

Tích hợp phụ trợ C++ cho các ứng dụng Python

Thư viện của chúng tôi tích hợp liền mạch với chương trình phụ trợ C++, cho phép các ứng dụng Python chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.

28 ngôn ngữ nhận dạng

Hỗ trợ nhiều ngôn ngữ và chữ viết đa dạng, bao gồm cả các ngôn ngữ hỗn hợp:

Tối ưu hóa khả năng nhận dạng bằng cách cho phép thư viện phát hiện ngôn ngữ hoặc xác định ngôn ngữ đó để cải thiện hiệu suất.

  • Bảng chữ cái Latin mở rộng: tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Rumani, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển;
  • Bảng chữ cái Cyrillic: tiếng Belorussian, tiếng Bulgaria, tiếng Kazakhstan, tiếng Nga, tiếng Serbia, tiếng Ukraina;
  • Tiếng Trung: Hơn 6.000 ký tự;
  • Tiếng Hindi.

Các tính năng chính

Aspose.OCR for Python via C++ Khám phá các khả năng nâng cao của Aspose.OCR cho Python thông qua C++.

Feature icon

Ảnh OCR

Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức quét.

Feature icon

PDF có thể tìm kiếm

Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.

Feature icon

Nhận dạng URL

Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.

Feature icon

Nhận dạng hàng loạt

Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.

Feature icon

Bất kỳ phông chữ và phong cách

Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.

Feature icon

Tinh chỉnh nhận dạng

Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.

Feature icon

Công cụ kiểm tra chính tả

Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.

Feature icon

Tìm văn bản trong hình ảnh

Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.

Feature icon

So sánh văn bản hình ảnh

So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.

Feature icon

Giới hạn phạm vi nhận dạng

Giới hạn bộ ký tự mà công cụ OCR sẽ tìm kiếm.

Feature icon

Phát hiện lỗi hình ảnh

Tự động tìm các khu vực hình ảnh có vấn đề.

Feature icon

Nhận biết khu vực

Chỉ tìm và đọc các vùng cụ thể của hình ảnh chứ không phải tất cả văn bản.

Mẫu mã Python

Khám phá các mẫu mã để tích hợp liền mạch Aspose.OCR cho Python thông qua C++ vào ứng dụng của bạn.

Cài đặt dễ dàng

Là một gói Python nhẹ hoặc một tệp có thể tải xuống với mức phụ thuộc tối thiểu, Aspose.OCR dành cho Python thông qua C++ đảm bảo phân phối dễ dàng. Tích hợp nó vào dự án của bạn trực tiếp từ Python và bạn đã sẵn sàng tận dụng các khả năng OCR hoàn chỉnh, lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Sau khi cài đặt, hãy bắt đầu ngay sử dụng Aspose.OCR cho Python qua C++, mặc dù có những hạn chế nhất định. Giấy phép tạm thời loại bỏ tất cả các hạn chế của phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Python qua C++ sau này.

Phát hiện vùng tài liệu

Bản quét hình ảnh hoặc ảnh chụp tài liệu văn bản thường bao gồm nhiều khối nội dung, bao gồm các đoạn văn bản, bảng biểu, hình minh họa, công thức, v.v. Việc nhận dạng thành công và chính xác các lĩnh vực quan tâm này trên một trang là rất quan trọng để OCR hiệu quả. Quá trình quan trọng này được gọi là phát hiện vùng tài liệu, liên quan đến việc xác định, tổ chức và phân loại các vùng nội dung riêng biệt.

Aspose.OCR cung cấp một số thuật toán phát hiện vùng tài liệu, cho phép bạn chọn thuật toán phù hợp nhất với nội dung cụ thể của mình.

Thiết lập cho nhiều nội dung hình ảnh khác nhau - Python OCR

settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE

input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)

Các định dạng đầu ra khác nhau

OCR cho C++ có thể lưu kết quả nhận dạng ở nhiều định dạng để có thể chia sẻ, lưu trữ trong cơ sở dữ liệu, hiển thị hoặc phân tích: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML. {index-content-python-cpp.code_samples.item3.content2}

Lưu kết quả nhận dạng vào JSON - Python

recognize_result_txt 
    = asposeocr.AsposeOCRSerializeResult(
      recognize_result, 
      asposeocr.ExportFormat.json)