Tại sao chọn Aspose.OCR cho Python qua .NET?

Bắt đầu cuộc hành trình với Aspose.OCR cho Python thông qua .NET - API OCR linh hoạt và thân thiện với người dùng. Nhúng chức năng OCR vào các ứng dụng Python của bạn với ít hơn 5 dòng mã, loại bỏ nhu cầu về mạng thần kinh hoặc toán học phức tạp. Công cụ OCR mạnh mẽ của chúng tôi mang lại tốc độ và độ chính xác tuyệt vời, hỗ trợ 28 ngôn ngữ, bao gồm chữ Latinh, Cyrillic và tiếng Trung. Cho dù đó là hình ảnh được quét, ảnh trên điện thoại thông minh, ảnh chụp màn hình hay tệp PDF được quét, đều thu được kết quả ở các định dạng trao đổi dữ liệu và tài liệu phổ biến. Tận dụng các bộ lọc tiền xử lý để xử lý hình ảnh bị xoay, lệch và nhiễu. Tối ưu hóa hiệu suất nhận dạng và tải hệ thống bằng cách giảm tải các tác vụ tiêu tốn nhiều tài nguyên cho phần phụ trợ .NET.

Illustration ocr

Làm chủ OCR hiệu quả và chính xác

Trải nghiệm tốc độ và độ chính xác tuyệt vời trong kết quả OCR với công nghệ Python và .NET tiên tiến.

Xuất sắc đa ngôn ngữ

Nhận dạng văn bản bằng 28 ngôn ngữ, bao gồm các chữ viết Latinh, Cyrillic và Trung Quốc một cách dễ dàng và chính xác.

Xử lý hình ảnh có thể thích ứng

Xử lý hình ảnh dễ dàng từ nhiều nguồn khác nhau – máy quét, máy ảnh và điện thoại thông minh – bằng cách sử dụng Python và .NET.

Thành thạo ký tự tiếng Trung

Đạt được khả năng nhận dạng chính xác hơn 6.000 ký tự tiếng Trung, đảm bảo độ chính xác với Python và .NET.

Bảo quản kiểu và định dạng phông chữ

Duy trì kiểu và định dạng phông chữ để thể hiện văn bản chính xác, nâng cao tính linh hoạt với Python và .NET.

Mẫu mã trực tiếp

Trải nghiệm sự đơn giản: Chuyển đổi hình ảnh thành văn bản chỉ bằng ba dòng mã Python!

Sẵn sàng công nhận Sẵn sàng công nhận Thả một tập tin ở đây hoặc bấm vào để duyệt *

* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụngChính sách bảo mật.

Kết quả công nhận
 

Chuyển đổi hình ảnh thành văn bản

Khám phá thêm ví dụ >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Trao quyền .NET cho Python ở mọi góc cạnh

Aspose.OCR cho Python thông qua .NET hoạt động liền mạch trên mọi nền tảng hỗ trợ .NET Framework 4.0 trở lên – có thể là máy cục bộ, web máy chủ hoặc đám mây.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Các định dạng tập tin được hỗ trợ

Aspose.OCR for Python via .NET có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.

Hình ảnh

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR hàng loạt

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Kết quả công nhận

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Cài đặt cho Python với phần phụ trợ .NET

Aspose.OCR dành cho Python qua .NET được phân phối dưới dạng gói Python với mức độ phụ thuộc tối thiểu hoặc dưới dạng tệp có thể tải xuống . Dễ dàng cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.

OCR mạnh mẽ cho các ứng dụng Python

Thư viện của chúng tôi tích hợp dễ dàng, cho phép các ứng dụng Python chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.

28 ngôn ngữ nhận dạng

API Python và .NET OCR của chúng tôi nhận dạng rất nhiều ngôn ngữ và tập lệnh viết phổ biến, bao gồm cả các ngôn ngữ hỗn hợp:

Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.

  • Bảng chữ cái Latin mở rộng: tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Rumani, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển;
  • Bảng chữ cái Cyrillic: tiếng Belorussian, tiếng Bulgaria, tiếng Kazakhstan, tiếng Nga, tiếng Serbia, tiếng Ukraina;
  • Tiếng Trung: Hơn 6.000 ký tự;
  • Tiếng Hindi.

Bộ lọc xử lý mạnh mẽ

Độ chính xác và độ tin cậy của nhận dạng ký tự quang học phụ thuộc rất nhiều vào chất lượng của ảnh gốc. Aspose.OCR cho Python thông qua .NET cung cấp một số lượng lớn các bộ lọc xử lý hình ảnh thủ công và hoàn toàn tự động nhằm cải thiện hình ảnh trước khi nó được gửi đến công cụ OCR:

  • Tự động làm thẳng hình ảnh được căn chỉnh một góc nhỏ so với phương ngang.
  • Xoay thủ công các hình ảnh bị lệch nghiêm trọng.
  • Tự động loại bỏ bụi bẩn, đốm, vết trầy xước, độ chói, độ dốc không mong muốn và tiếng ồn khác.
  • Tự động điều chỉnh độ tương phản của hình ảnh.
  • Tự động nâng cấp hoặc thay đổi kích thước hình ảnh theo cách thủ công.
  • Chuyển đổi hình ảnh sang màu đen trắng hoặc thang độ xám.
  • Đảo ngược màu sắc của hình ảnh để vùng sáng trông tối và vùng tối trông sáng.
  • Tăng độ dày của ký tự trong ảnh.
  • Làm mờ hình ảnh nhiễu trong khi vẫn giữ được các cạnh của chữ cái.
  • Làm thẳng độ cong của trang và khắc phục hiện tượng méo ống kính máy ảnh cho ảnh trang.

Tối ưu hóa cho các loại tài liệu cụ thể

Aspose.OCR cho Python thông qua .NET cung cấp các mạng thần kinh được đào tạo đặc biệt để trích xuất văn bản từ một số loại hình ảnh nhất định với độ chính xác tối đa:

Trình kiểm tra chính tả tích hợp

Mặc dù Aspose.OCR cho Python qua .NET cung cấp độ chính xác nhận dạng cao, nhưng lỗi in, bụi bẩn hoặc phông chữ không chuẩn có thể khiến một số ký tự hoặc từ nhất định được nhận dạng không chính xác. Để cải thiện hơn nữa kết quả nhận dạng, bạn có thể bật trình kiểm tra chính tả, tính năng này sẽ tìm và tự động sửa lỗi chính tả dựa trên ngôn ngữ nhận dạng đã chọn.

Nếu văn bản được nhận dạng chứa thuật ngữ chuyên ngành, từ viết tắt và các từ khác không có trong từ điển chính tả thông thường, bạn có thể cung cấp danh sách từ của riêng mình.

Nhận dạng hàng loạt được đơn giản hóa

API Python OCR của chúng tôi giúp bạn không phải nhận dạng từng hình ảnh một. Sử dụng nhiều phương pháp xử lý hàng loạt khác nhau để nhận dạng nhiều hình ảnh trong một lệnh gọi:

  • Nhận dạng các tệp PDF, TIFF và DjVu nhiều trang.
  • Nhận dạng tất cả các tập tin trong một thư mục.
  • Nhận dạng tất cả các tập tin trong một kho lưu trữ.
  • Nhận dạng tất cả các tập tin từ một danh sách.

Học qua các ví dụ về Python

Aspose.OCR cho Python thông qua .NET cung cấp một loạt ví dụ được viết bằng Python, cho phép bạn nhanh chóng làm quen với các chức năng của nó và khả năng. Nhận thông tin chi tiết để tạo các giải pháp phù hợp nhằm đáp ứng nhu cầu kinh doanh Python của bạn.

Tính năng và khả năng

Aspose.OCR for Python via .NET Khám phá các khả năng nâng cao của Aspose.OCR cho C++.

Feature icon

Ảnh OCR

Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức quét.

Feature icon

PDF có thể tìm kiếm

Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.

Feature icon

Nhận dạng URL

Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.

Feature icon

Nhận dạng hàng loạt

Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.

Feature icon

Bất kỳ phông chữ và phong cách

Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.

Feature icon

Tinh chỉnh nhận dạng

Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.

Feature icon

Công cụ kiểm tra chính tả

Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.

Feature icon

Tìm văn bản trong hình ảnh

Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.

Feature icon

So sánh văn bản hình ảnh

So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.

Mẫu mã Python

Đi sâu vào các mẫu mã để tích hợp liền mạch Aspose.OCR cho Python thông qua .NET vào các ứng dụng Python của bạn.

Thành thạo cài đặt bằng Python

Được phân phối dưới dạng Python Wheel hoặc gói có thể tải xuống độc lập, Aspose.OCR cho Python qua .NET được phân phối dễ dàng. Tích hợp vào dự án Python của bạn, trực tiếp từ Môi trường phát triển tích hợp Python (IDE) ưa thích của bạn, là một quá trình liền mạch. Chỉ cần cài đặt nó và bạn đã sẵn sàng tận dụng toàn bộ khả năng OCR, lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Sau khi cài đặt, bạn có thể nhanh chóng bắt đầu sử dụng Aspose.OCR cho Python qua .NET , mặc dù có những hạn chế nhất định. Giấy phép tạm thời dỡ bỏ tất cả các hạn chế về phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Python qua .NET ở giai đoạn sau.

Tải giấy phép

lic = License()
lic.set_license(self.licPath)

Nhận dạng văn bản trên Ảnh

Đọc văn bản từ bất kỳ nội dung nào trong Aspose.OCR cho Python qua .NET cũng dễ dàng như gọi một phương thức nhận dạng phổ quát ().

Chuyển ảnh thành văn bản - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Bộ chuyển đổi phổ quát Python

API của chúng tôi đọc thành thạo mọi hình ảnh từ máy quét, máy ảnh hoặc điện thoại thông minh: tài liệu PDF, JPEG, PNG, TIFF, GIF, hình ảnh BMP và thậm chí cả tệp DjVu. Hỗ trợ đầy đủ cho các tài liệu PDF nhiều trang, hình ảnh TIFF và DjVu đảm bảo tính linh hoạt. Bạn cũng có thể cung cấp hình ảnh từ web thông qua URL.

Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tài liệu phổ biến: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.

Nhận dạng PDF và lưu kết quả sang các định dạng đầu ra khác nhau - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Tối ưu hóa tài nguyên trong Python

Nhận dạng ký tự quang học đòi hỏi tài nguyên. API của chúng tôi cung cấp những cách linh hoạt để cân bằng bộ ba chất lượng-giá-thời gian cổ điển:

  • Chọn giữa nhận dạng kỹ lưỡng và nhận dạng nhanh.
  • Chỉ định số lượng luồng được phân bổ để nhận dạng hoặc cho phép thư viện tự động chia tỷ lệ theo số lõi bộ xử lý.
  • Giải phóng CPU bằng cách giảm tải các phép tính cho phần phụ trợ .NET.

Nhận dạng nhanh - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Nhận biết dòng đơn

Nếu hình ảnh của bạn đã được cắt thành một dòng văn bản, nó có thể được nhận dạng ở chế độ nhanh nhất có thể mà không cần chỉnh sửa tự động, phát hiện cấu trúc nội dung và các bước tiêu tốn tài nguyên khác. Nó có thể tăng tốc độ OCR nhanh hơn tới 7 lần so với quá trình nhận dạng thông thường.

Nhận dạng một dòng văn bản trên hình ảnh - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)