Чому Aspose.OCR для Python через Java?

Aspose.OCR для Python через Java бездоганно інтегрує потужні можливості оптичного розпізнавання символів (OCR) у ваші кросплатформні ноутбуки та програми Python. За допомогою нашого інтуїтивно зрозумілого та високошвидкісного API ви можете без особливих зусиль отримувати текст зі сканованих зображень, скріншотів, веб-посилань або фотографій зі смартфона, надаючи результати, готові для консолідації, аналізу чи зберігання. Розпізнавайте відскановані зображення, фотографії зі смартфона, знімки екрана та відскановані PDF-файли, зберігаючи результати в популярних форматах документів. Розширені фільтри попередньої обробки обробляють повернуті, перекошені та шумні зображення. Оптимізуйте продуктивність, переклавши завдання на GPU.

Illustration ocr

Швидке та точне OCR

Отримайте високошвидкісні та точні результати OCR за допомогою нашої передової технології Python через Java.

Багатомовна підтримка

Розпізнавайте текст 28 мовами, включно з латиницею, кирилицею та китайською мовою, забезпечуючи універсальність ваших програм Python через Java.

Гнучка підтримка зображень

Безпроблемно обробляйте зображення зі сканерів, камер і смартфонів за допомогою Python через Java.

Точність розпізнавання китайських ієрогліфів

Розпізнавайте понад 6000 китайських ієрогліфів із точністю у своїх проектах Python через Java.

Зберігайте стилі шрифтів і форматування

Підтримуйте стилі шрифтів і форматування для точного представлення розпізнаного тексту у ваших програмах Python через Java.

Приклад живого коду

Розпочніть розпізнавання тексту із зображень лише за допомогою трьох рядків коду. Відчуйте простоту!

Готовий розпізнати Готовий розпізнати Перетягніть файл сюди або натисніть, щоб переглянути *

* Завантажуючи свої файли або користуючись сервісом, ви погоджуєтеся з нашими Умови використання і Політика конфіденційності.

Результат розпізнавання
 

Перетворення зображення на текст

Більше прикладів >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Виберіть платформу

Виберіть бібліотеку, яка найкраще підходить для ваших потреб.

Гнучкість

Python via .NET

Зручна розробка та легкочитаний код
Найширший функціонал
Може бути трохи повільнішою, ніж інші бібліотеки

Універсальність

Python via Java

Використовуйте єдину бібліотеку на будь-якій платформі
Запускайте ваш додаток на будь-якому пристрої
Потрібне Java Runtime Environment (JRE) 8 або новіше

Швидкість

Python via C++

Гарантована швидкість на будь-якій платформі
Гнучке управління ресурсами та продуктивністю
Орієнтовано на досвідчених розробників

Сумісність Java Backend

Наша бібліотека, розроблена як модуль Python, забезпечує сумісність із основними операційними системами, що підтримують Java , включаючи Microsoft Windows, Linux і macOS, або хмарні платформи. Це дає змогу розробляти додатки на одній платформі та безперешкодно запускати їх на іншій, усуваючи потребу будь-яких модифікацій коду.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Підтримувані формати файлів

Aspose.OCR for Python via Java може працювати практично з будь-яким файлом можна отримати зі сканера або камери. Результати розпізнавання повертаються в найпопулярніших форматах обміну файлами та даними, які можна зберігати, імпортувати до бази даних або аналізувати в реальному часі.

Зображення

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Пакетне OCR

  • Multi-page PDF
  • ZIP
  • Folder

Результати розпізнавання

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Легке встановлення для Python через Java

Aspose.OCR для Python через Java поставляється як пакет Python або як файл для завантаження з мінімальними залежностями. Легко встановіть його у свій проект, і ви готові розпізнавати тексти кількома підтримуваними мовами та зберігати результати розпізнавання в різних форматах.

Подайте запит на пробну ліцензію , щоб розпочати розробку повнофункціональної програми OCR без обмежень.

Потужне OCR для програм Python

Наша бібліотека легко інтегрується, дозволяючи програмам Python безперебійно працювати на будь-якій платформі – Windows, Windows Server, macOS, Linux і хмарі.

28 Мови розпізнавання

Наш API OCR для Python і Java розпізнає безліч мов і популярних сценаріїв написання, включаючи змішані мови:

Залиште визначення мови бібліотеці або визначте мову самостійно для підвищення продуктивності та надійності розпізнавання.

  • Розширена латиниця: хорватська, чеська, датська, голландська, англійська, естонська, фінська, французька, німецька, італійська, латвійська, литовська, норвезька, польська, португальська, румунська, словацька, словенська, іспанська, шведська;
  • кирилиця: білоруська, болгарська, казахська, російська, сербська, українська;
  • китайська: понад 6000 символів;
  • Хінді.

Покращені фільтри обробки зображень

Точність оптичного розпізнавання символів значною мірою залежить від якості вихідного зображення. Aspose.OCR для Python через Java пропонує широкий набір автоматичних і ручних фільтрів обробки зображень для оптимізації зображення перед надсиланням до механізму OCR:

  • Автоматично вирівняти злегка нахилені зображення.
  • Вручну виправте поворот сильно перекошених зображень.
  • Автоматично видаляйте бруд, плями, подряпини, відблиски, небажані градієнти та інші типи шуму.
  • Автоматичне налаштування контрастності зображення.
  • Автоматично збільшити або вручну змінити розмір зображення.
  • Перетворення зображень на чорно-біле або в градаціях сірого.
  • Інвертуйте кольори зображення, роблячи світлі ділянки темними, а темні — світлими.
  • Збільште товщину символів на зображенні.
  • Розмивайте зображення з шумом, зберігаючи краї букв.
  • Вирівняйте перекіс сторінки та виправте спотворення об’єктива камери на фотографіях сторінки.

Спеціалізовані API для різних типів документів

Aspose.OCR для Python через Java пропонує спеціально навчені нейронні мережі для вилучення тексту з певних типів зображень із максимальною точністю:

  • Відскановані або сфотографовані ідентифікаційні картки та паспорти.
  • Номерні знаки транспортних засобів.
  • Рахунки-фактури.
  • Квитанції.

Вбудована перевірка орфографії

Хоча Aspose.OCR для Python через Java забезпечує високу точність розпізнавання, дефекти друку, бруд або нестандартні шрифти можуть призвести до неправильного розпізнавання певних символів або слів. Щоб ще більше покращити результати розпізнавання, ви можете ввімкнути перевірку орфографії, яка знаходить і автоматично виправляє орфографічні помилки на основі вибраної мови розпізнавання.

Якщо розпізнаний текст містить спеціальну термінологію, абревіатури та інші слова, яких немає в загальноприйнятих орфографічних словниках, ви можете надати власні списки слів.

Ефективне розпізнавання пакетів

Наш API OCR на Python дає змогу оптимізувати розпізнавання зображень. Використовуйте різноманітні методи пакетної обробки для ефективної обробки кількох зображень за один виклик:

  • Розпізнавання багатосторінкових файлів PDF, TIFF.
  • Обробляти всі файли в папці.
  • Керувати розпізнаванням для всіх файлів в архіві.
  • Розпізнавати зображення з указаного списку.

Навчання на прикладах Python

Перегляньте різноманітні приклади Python , розроблені, щоб допомогти вам швидко зрозуміти функції та можливості нашого рішення OCR. Швидко отримайте знання про створення індивідуальних рішень, які відповідають конкретним вимогам вашого бізнесу.

Особливості та можливості

Aspose.OCR for Python via Java Ознайомтеся з розширеними функціями Aspose.OCR для Python

Feature icon

Фото OCR

Витягуйте текст із фотографій смартфона з точністю сканування.

Feature icon

PDF з можливістю пошуку

Перетворюйте будь-яке скановане зображення на документ із можливістю пошуку та індексування.

Feature icon

розпізнавання URL

Розпізнайте зображення за URL-адресою, не завантажуючи його локально.

Feature icon

Масове розпізнавання

Читайте всі зображення з багатосторінкових документів, папок і архівів.

Feature icon

Будь-який шрифт і стиль

Визначайте та розпізнавайте текст усіх популярних шрифтів і стилів.

Feature icon

Точне налаштування розпізнавання

Налаштуйте кожен параметр OCR для найкращих результатів розпізнавання.

Feature icon

Перевірка орфографії

Покращуйте результати, автоматично виправляючи слова з помилками.

Feature icon

Знайдіть текст на малюнках

Шукайте текст або регулярний вираз у наборі зображень.

Feature icon

Порівняйте тексти зображень

Порівняйте тексти на двох зображеннях, незалежно від регістру та компонування.

Зразки коду Python

Відкрийте для себе зразки коду, щоб легко інтегрувати Aspose.OCR для Python через Java у ваші програми.

Легке встановлення

Як пакет Python або файл для завантаження з мінімальними залежностями, Aspose.OCR для Python через Java забезпечує легке розповсюдження. Інтегруйте його у свій проект безпосередньо з Python, і ви будете готові використовувати повні можливості OCR, зберігаючи результати розпізнавання в різних форматах.

Після інсталяції негайно почніть використовувати Aspose.OCR для Python через Java, хоч і з певними обмеженнями. Тимчасова ліцензія знімає всі обмеження пробної версії на 30 днів. Використайте цей період, щоб розпочати розробку повнофункціональної програми OCR, яка дозволить вам пізніше прийняти обґрунтоване рішення щодо придбання Aspose.OCR для Python через Java.

Ліцензія на завантаження

lic = License()
lic.set_license(self.licPath)

Розпізнавання зображень

Основною проблемою в додатках OCR є дефіцит сканерів для кінцевих користувачів. Наш API, повністю інтегрований із Python через Java, має надійні вбудовані фільтри попередньої обробки зображень, які обробляють повернуті, перекошені та зашумлені зображення. У поєднанні з підтримкою всіх форматів зображень це дозволяє надійно розпізнавати навіть фотографії зі смартфона. Більшість процесів попередньої обробки та корекції зображень автоматизовані, тому ваше втручання потрібне лише у складних випадках.

Застосовувати автоматичні виправлення зображень - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Універсальний конвертер Python

Наш API вміло зчитує будь-яке зображення зі сканерів, камер або смартфонів: документи PDF, файли JPEG, PNG, TIFF, GIF, BMP. Повна підтримка багатосторінкових PDF-документів, зображень TIFF і DjVu забезпечує універсальність. Ви також можете надати зображення з Інтернету через URL-адресу.

Результати розпізнавання повертаються в популярних форматах документів і обміну даними: простий текст, PDF, Microsoft Word, Microsoft Excel, JSON і XML.

Розпізнавання PDF і збереження результатів у різних вихідних форматах - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Оптимізація використання ресурсів

OCR пропонує спеціальний алгоритм розпізнавання для вилучення вмісту із зображень із розрідженим текстом і шумним/кольоровим фоном. Цей метод значно покращує точність OCR у таких бізнес-кейсах:

  • Прочитайте текст із вуличних фотографій.
  • Сегментуйте та ідентифікуйте дорожні знаки та вивіски на зображеннях вулиць.
  • Знайдіть цінники та інтерпретуйте витягнутий текст як ціни.
  • Знайдіть і об’єднайте цікаві регіони на етикетках харчових продуктів, як-от інформацію про поживну цінність або списки інгредієнтів.
  • Ідентифікувати та аналізувати номерні знаки автомобілів.
  • Вилучення тексту з меню та каталогів.

Відкрита область OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Вилучення тексту з вуличних фотографій

OCR для Python пропонує спеціальний алгоритм розпізнавання, який витягує текст з номерних знаків автомобіля, включно з темними та розмитими фотографіями. Потім отриманий текст можна автоматично зберегти в базі даних або автоматично перевірити.

Розпізнай номер автомобіля - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)