Tại sao Aspose.OCR cho Python thông qua Java?

Aspose.OCR cho Python thông qua Java tích hợp liền mạch các khả năng nhận dạng ký tự quang học (OCR) mạnh mẽ vào các ứng dụng và sổ ghi chép Python đa nền tảng của bạn. Với API trực quan và tốc độ cao của chúng tôi, bạn có thể dễ dàng trích xuất văn bản từ bản quét, ảnh chụp màn hình, liên kết web hoặc ảnh trên điện thoại thông minh, mang lại kết quả sẵn sàng để tổng hợp, phân tích hoặc lưu trữ. Nhận dạng hình ảnh được quét, ảnh trên điện thoại thông minh, ảnh chụp màn hình và tệp PDF được quét, lưu kết quả ở các định dạng tài liệu phổ biến. Các bộ lọc tiền xử lý nâng cao xử lý hình ảnh bị xoay, lệch và nhiễu. Tối ưu hóa hiệu suất bằng cách giảm tải các tác vụ cho GPU.

Illustration ocr

OCR nhanh chóng và chính xác

Đạt được kết quả OCR tốc độ cao và chính xác với Python tiên tiến của chúng tôi thông qua công nghệ Java.

Hỗ trợ đa ngôn ngữ

Nhận dạng văn bản bằng 28 ngôn ngữ, bao gồm chữ viết Latinh, Cyrillic và tiếng Trung, đảm bảo tính linh hoạt cho các ứng dụng Python của bạn thông qua Java.

Hỗ trợ hình ảnh linh hoạt

Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách liền mạch bằng Python qua Java.

Độ chính xác trong nhận dạng ký tự tiếng Trung

Nhận dạng chính xác hơn 6.000 ký tự tiếng Trung trong các dự án Python của bạn thông qua Java.

Giữ nguyên kiểu và định dạng phông chữ

Duy trì kiểu và định dạng phông chữ để thể hiện chính xác văn bản được nhận dạng trong các ứng dụng Python của bạn thông qua Java.

Mẫu mã trực tiếp

Bắt đầu nhận dạng văn bản từ hình ảnh chỉ bằng ba dòng mã. Trải nghiệm sự đơn giản!

Sẵn sàng công nhận Sẵn sàng công nhận Thả một tập tin ở đây hoặc bấm vào để duyệt *

* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụngChính sách bảo mật.

Kết quả công nhận
 

Chuyển đổi hình ảnh thành văn bản

Thêm ví dụ >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Khả năng tương thích phụ trợ Java

Được thiết kế dưới dạng mô-đun Python, thư viện của chúng tôi đảm bảo khả năng tương thích trên các hệ điều hành chính hỗ trợ Java - bao gồm Microsoft Windows, Linux và macOS hoặc nền tảng đám mây. Điều này cho phép bạn phát triển các ứng dụng trên một nền tảng và chạy chúng liền mạch trên nền tảng khác, loại bỏ nhu cầu sửa đổi mã.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Các định dạng tập tin được hỗ trợ

Aspose.OCR for Python via Java có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.

Hình ảnh

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR hàng loạt

  • Multi-page PDF
  • ZIP
  • Folder

Kết quả công nhận

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Cài đặt dễ dàng cho Python qua Java

Aspose.OCR dành cho Python qua Java được phân phối dưới dạng gói Python hoặc dưới dạng tệp có thể tải xuống với mức độ phụ thuộc tối thiểu. Dễ dàng cài đặt vào dự án của bạn và bạn đã sẵn sàng nhận dạng văn bản bằng nhiều ngôn ngữ được hỗ trợ và lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.

OCR mạnh mẽ cho các ứng dụng Python

Thư viện của chúng tôi tích hợp dễ dàng, cho phép các ứng dụng Python chạy liền mạch trên mọi nền tảng – máy tính để bàn Windows, Windows Server, macOS, Linux và đám mây.

28 ngôn ngữ nhận dạng

API Python và Java OCR của chúng tôi nhận dạng rất nhiều ngôn ngữ và tập lệnh viết phổ biến, bao gồm cả các ngôn ngữ hỗn hợp:

Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.

  • Bảng chữ cái Latin mở rộng: tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Rumani, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển;
  • Bảng chữ cái Cyrillic: tiếng Belorussian, tiếng Bulgaria, tiếng Kazakhstan, tiếng Nga, tiếng Serbia, tiếng Ukraina;
  • Tiếng Trung: Hơn 6.000 ký tự;
  • Tiếng Hindi.

Bộ lọc xử lý hình ảnh nâng cao

Độ chính xác của nhận dạng ký tự quang học phụ thuộc rất nhiều vào chất lượng của ảnh gốc. Aspose.OCR cho Python thông qua Java cung cấp một loạt các bộ lọc xử lý hình ảnh tự động và thủ công để tối ưu hóa hình ảnh trước khi gửi tới công cụ OCR:

  • Tự động làm thẳng hình ảnh hơi nghiêng.
  • Chỉnh sửa thủ công việc xoay các hình ảnh bị lệch nghiêm trọng.
  • Tự động loại bỏ bụi bẩn, đốm, vết trầy xước, độ chói, độ dốc không mong muốn và các loại tiếng ồn khác.
  • Tự động điều chỉnh độ tương phản của hình ảnh.
  • Tự động nâng cấp hoặc thay đổi kích thước hình ảnh theo cách thủ công.
  • Chuyển đổi hình ảnh sang màu đen trắng hoặc thang độ xám.
  • Đảo ngược màu sắc của hình ảnh, làm cho vùng sáng trở nên tối và vùng tối trở nên sáng.
  • Tăng độ dày của ký tự trong ảnh.
  • Làm mờ hình ảnh nhiễu trong khi vẫn giữ được các cạnh chữ.
  • Làm thẳng trang bị nghiêng và sửa độ méo của ống kính máy ảnh trong ảnh trang.

API được chỉ định cho các loại tài liệu khác nhau

Aspose.OCR cho Python thông qua Java cung cấp các mạng thần kinh được đào tạo đặc biệt để trích xuất văn bản từ một số loại hình ảnh nhất định với độ chính xác tối đa:

  • Bản scan hoặc chụp ảnh CMND, hộ chiếu.
  • Biển số xe.
  • Hóa đơn.
  • Biên lai.

Trình kiểm tra chính tả tích hợp

Mặc dù Aspose.OCR cho Python qua Java cung cấp độ chính xác nhận dạng cao, nhưng lỗi in, bụi bẩn hoặc phông chữ không chuẩn có thể khiến một số ký tự hoặc từ nhất định được nhận dạng không chính xác. Để cải thiện hơn nữa kết quả nhận dạng, bạn có thể bật trình kiểm tra chính tả, tính năng này sẽ tìm và tự động sửa lỗi chính tả dựa trên ngôn ngữ nhận dạng đã chọn.

Nếu văn bản được nhận dạng chứa thuật ngữ chuyên ngành, từ viết tắt và các từ khác không có trong từ điển chính tả thông thường, bạn có thể cung cấp danh sách từ của riêng mình.

Nhận dạng hàng loạt hiệu quả

API Python OCR của chúng tôi cho phép bạn hợp lý hóa việc nhận dạng hình ảnh. Sử dụng các phương pháp xử lý hàng loạt linh hoạt để xử lý hiệu quả nhiều hình ảnh trong một lệnh gọi:

  • Nhận dạng tệp PDF, TIFF nhiều trang.
  • Xử lý tất cả các tập tin trong một thư mục.
  • Xử lý nhận dạng cho tất cả các tệp trong kho lưu trữ.
  • Nhận dạng hình ảnh từ một danh sách được chỉ định.

Học qua ví dụ Python

Khám phá nhiều ví dụ về Python được thiết kế để giúp bạn nhanh chóng nắm bắt được các chức năng và khả năng của giải pháp OCR của chúng tôi. Nhanh chóng hiểu rõ hơn về việc tạo các giải pháp tùy chỉnh đáp ứng yêu cầu kinh doanh cụ thể của bạn.

Tính năng và khả năng

Aspose.OCR for Python via Java Khám phá các tính năng nâng cao của Aspose.OCR cho Python

Feature icon

Ảnh OCR

Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức quét.

Feature icon

PDF có thể tìm kiếm

Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.

Feature icon

Nhận dạng URL

Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.

Feature icon

Nhận dạng hàng loạt

Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.

Feature icon

Bất kỳ phông chữ và phong cách

Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.

Feature icon

Tinh chỉnh nhận dạng

Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.

Feature icon

Công cụ kiểm tra chính tả

Cải thiện kết quả bằng cách tự động sửa các từ sai chính tả.

Feature icon

Tìm văn bản trong hình ảnh

Tìm kiếm văn bản hoặc biểu thức chính quy trong một tập hợp hình ảnh.

Feature icon

So sánh văn bản hình ảnh

So sánh văn bản trên hai hình ảnh, bất kể kiểu chữ và bố cục.

Mẫu mã Python

Khám phá các mẫu mã để tích hợp liền mạch Aspose.OCR cho Python qua Java vào ứng dụng của bạn.

Cài đặt dễ dàng

Là một gói Python hoặc một tệp có thể tải xuống với mức độ phụ thuộc tối thiểu, Aspose.OCR dành cho Python qua Java đảm bảo việc phân phối dễ dàng. Tích hợp nó vào dự án của bạn trực tiếp từ Python và bạn đã sẵn sàng tận dụng các khả năng OCR hoàn chỉnh, lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Sau khi cài đặt, hãy bắt đầu ngay sử dụng Aspose.OCR cho Python qua Java, mặc dù có những hạn chế nhất định. Giấy phép tạm thời loại bỏ tất cả các hạn chế của phiên bản dùng thử trong 30 ngày. Tận dụng khoảng thời gian này để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng, cho phép bạn đưa ra quyết định sáng suốt về việc mua Aspose.OCR cho Python qua Java sau này.

Tải giấy phép

lic = License()
lic.set_license(self.licPath)

Nhận dạng hình ảnh

Thách thức chính trong các ứng dụng OCR là sự khan hiếm máy quét cho người dùng cuối. API của chúng tôi, được tích hợp liền mạch với Python thông qua Java, có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ để xử lý các hình ảnh bị xoay, lệch và nhiễu. Kết hợp với sự hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy, ngay cả từ ảnh trên điện thoại thông minh. Hầu hết quá trình xử lý trước và chỉnh sửa hình ảnh đều được tự động hóa, chỉ yêu cầu bạn can thiệp trong những trường hợp khó khăn.

Áp dụng chỉnh sửa hình ảnh tự động - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Bộ chuyển đổi phổ quát Python

API của chúng tôi đọc thành thạo mọi hình ảnh từ máy quét, máy ảnh hoặc điện thoại thông minh: tài liệu PDF, tệp JPEG, PNG, TIFF, GIF, BMP. Hỗ trợ đầy đủ cho các tài liệu PDF nhiều trang, hình ảnh TIFF và DjVu đảm bảo tính linh hoạt. Bạn cũng có thể cung cấp hình ảnh từ web thông qua URL.

Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tài liệu phổ biến: văn bản thuần túy, PDF, Microsoft Word, Microsoft Excel, JSON và XML.

Nhận dạng PDF và lưu kết quả sang các định dạng đầu ra khác nhau - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Tối ưu hóa việc sử dụng tài nguyên

OCR cung cấp một thuật toán nhận dạng đặc biệt để trích xuất nội dung từ hình ảnh có văn bản thưa thớt và nền nhiễu/màu. Phương pháp này cải thiện đáng kể độ chính xác của OCR trong các trường hợp kinh doanh sau:

  • Đọc văn bản từ ảnh đường phố.
  • Phân đoạn và xác định các biển báo và biển báo đường trong hình ảnh đường phố.
  • Xác định vị trí thẻ giá và giải thích văn bản được trích xuất là giá.
  • Tìm và tổng hợp các vùng quan tâm trên nhãn thực phẩm, chẳng hạn như thông tin dinh dưỡng hoặc danh sách thành phần.
  • Nhận dạng và phân tích biển số xe.
  • Trích xuất văn bản từ menu và danh mục.

Vùng mở OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Trích xuất văn bản từ ảnh đường phố

OCR cho Python cung cấp một thuật toán nhận dạng đặc biệt giúp trích xuất văn bản từ biển số xe, bao gồm cả ảnh tối và mờ. Văn bản kết quả sau đó có thể được tự động lưu vào cơ sở dữ liệu hoặc tự động xác minh.

Nhận biết số xe - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)