Майстерність перетворення зображення в текст за допомогою Python через Java
Розпізнавайте текст на зображеннях за допомогою Python
Більше вітрин ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Чому Aspose.OCR для Python через Java?
Aspose.OCR для Python через Java бездоганно інтегрує потужні можливості оптичного розпізнавання символів (OCR) у ваші кросплатформні ноутбуки та програми Python. За допомогою нашого інтуїтивно зрозумілого та високошвидкісного API ви можете без особливих зусиль отримувати текст зі сканованих зображень, скріншотів, веб-посилань або фотографій зі смартфона, надаючи результати, готові для консолідації, аналізу чи зберігання. Розпізнавайте відскановані зображення, фотографії зі смартфона, знімки екрана та відскановані PDF-файли, зберігаючи результати в популярних форматах документів. Розширені фільтри попередньої обробки обробляють повернуті, перекошені та шумні зображення. Оптимізуйте продуктивність, переклавши завдання на GPU.
Швидке та точне OCR
Отримайте високошвидкісні та точні результати OCR за допомогою нашої передової технології Python через Java.
Багатомовна підтримка
Розпізнавайте текст 28 мовами, включно з латиницею, кирилицею та китайською мовою, забезпечуючи універсальність ваших програм Python через Java.
Гнучка підтримка зображень
Безпроблемно обробляйте зображення зі сканерів, камер і смартфонів за допомогою Python через Java.
Точність розпізнавання китайських ієрогліфів
Розпізнавайте понад 6000 китайських ієрогліфів із точністю у своїх проектах Python через Java.
Зберігайте стилі шрифтів і форматування
Підтримуйте стилі шрифтів і форматування для точного представлення розпізнаного тексту у ваших програмах Python через Java.
Приклад живого коду
Розпочніть розпізнавання тексту із зображень лише за допомогою трьох рядків коду. Відчуйте простоту!
* Завантажуючи свої файли або користуючись сервісом, ви погоджуєтеся з нашими Умови використання і Політика конфіденційності.
Перетворення зображення на текст
Більше прикладів ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Виберіть платформу
Виберіть бібліотеку, яка найкраще підходить для ваших потреб.
Гнучкість
Python via .NET
Універсальність
Python via Java
Швидкість
Python via C++
Сумісність Java Backend
Наша бібліотека, розроблена як модуль Python, забезпечує сумісність із основними операційними системами, що підтримують Java , включаючи Microsoft Windows, Linux і macOS, або хмарні платформи. Це дає змогу розробляти додатки на одній платформі та безперешкодно запускати їх на іншій, усуваючи потребу будь-яких модифікацій коду.
Підтримувані формати файлів
Aspose.OCR for Python via Java може працювати практично з будь-яким файлом можна отримати зі сканера або камери. Результати розпізнавання повертаються в найпопулярніших форматах обміну файлами та даними, які можна зберігати, імпортувати до бази даних або аналізувати в реальному часі.
Зображення
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Пакетне OCR
- Multi-page PDF
- ZIP
- Folder
Результати розпізнавання
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Легке встановлення для Python через Java
Aspose.OCR для Python через Java поставляється як пакет Python або як файл для завантаження з мінімальними залежностями. Легко встановіть його у свій проект, і ви готові розпізнавати тексти кількома підтримуваними мовами та зберігати результати розпізнавання в різних форматах.
Подайте запит на пробну ліцензію , щоб розпочати розробку повнофункціональної програми OCR без обмежень.
Потужне OCR для програм Python
Наша бібліотека легко інтегрується, дозволяючи програмам Python безперебійно працювати на будь-якій платформі – Windows, Windows Server, macOS, Linux і хмарі.
28 Мови розпізнавання
Наш API OCR для Python і Java розпізнає безліч мов і популярних сценаріїв написання, включаючи змішані мови:
Залиште визначення мови бібліотеці або визначте мову самостійно для підвищення продуктивності та надійності розпізнавання.
- Розширена латиниця: хорватська, чеська, датська, голландська, англійська, естонська, фінська, французька, німецька, італійська, латвійська, литовська, норвезька, польська, португальська, румунська, словацька, словенська, іспанська, шведська;
- кирилиця: білоруська, болгарська, казахська, російська, сербська, українська;
- китайська: понад 6000 символів;
- Хінді.
Покращені фільтри обробки зображень
Точність оптичного розпізнавання символів значною мірою залежить від якості вихідного зображення. Aspose.OCR для Python через Java пропонує широкий набір автоматичних і ручних фільтрів обробки зображень для оптимізації зображення перед надсиланням до механізму OCR:
- Автоматично вирівняти злегка нахилені зображення.
- Вручну виправте поворот сильно перекошених зображень.
- Автоматично видаляйте бруд, плями, подряпини, відблиски, небажані градієнти та інші типи шуму.
- Автоматичне налаштування контрастності зображення.
- Автоматично збільшити або вручну змінити розмір зображення.
- Перетворення зображень на чорно-біле або в градаціях сірого.
- Інвертуйте кольори зображення, роблячи світлі ділянки темними, а темні — світлими.
- Збільште товщину символів на зображенні.
- Розмивайте зображення з шумом, зберігаючи краї букв.
- Вирівняйте перекіс сторінки та виправте спотворення об’єктива камери на фотографіях сторінки.
Спеціалізовані API для різних типів документів
Aspose.OCR для Python через Java пропонує спеціально навчені нейронні мережі для вилучення тексту з певних типів зображень із максимальною точністю:
- Відскановані або сфотографовані ідентифікаційні картки та паспорти.
- Номерні знаки транспортних засобів.
- Рахунки-фактури.
- Квитанції.
Вбудована перевірка орфографії
Хоча Aspose.OCR для Python через Java забезпечує високу точність розпізнавання, дефекти друку, бруд або нестандартні шрифти можуть призвести до неправильного розпізнавання певних символів або слів. Щоб ще більше покращити результати розпізнавання, ви можете ввімкнути перевірку орфографії, яка знаходить і автоматично виправляє орфографічні помилки на основі вибраної мови розпізнавання.
Якщо розпізнаний текст містить спеціальну термінологію, абревіатури та інші слова, яких немає в загальноприйнятих орфографічних словниках, ви можете надати власні списки слів.
Ефективне розпізнавання пакетів
Наш API OCR на Python дає змогу оптимізувати розпізнавання зображень. Використовуйте різноманітні методи пакетної обробки для ефективної обробки кількох зображень за один виклик:
- Розпізнавання багатосторінкових файлів PDF, TIFF.
- Обробляти всі файли в папці.
- Керувати розпізнаванням для всіх файлів в архіві.
- Розпізнавати зображення з указаного списку.
Навчання на прикладах Python
Перегляньте різноманітні приклади Python , розроблені, щоб допомогти вам швидко зрозуміти функції та можливості нашого рішення OCR. Швидко отримайте знання про створення індивідуальних рішень, які відповідають конкретним вимогам вашого бізнесу.
Особливості та можливості
Aspose.OCR for Python via Java Ознайомтеся з розширеними функціями Aspose.OCR для Python
Фото OCR
Витягуйте текст із фотографій смартфона з точністю сканування.
PDF з можливістю пошуку
Перетворюйте будь-яке скановане зображення на документ із можливістю пошуку та індексування.
розпізнавання URL
Розпізнайте зображення за URL-адресою, не завантажуючи його локально.
Масове розпізнавання
Читайте всі зображення з багатосторінкових документів, папок і архівів.
Будь-який шрифт і стиль
Визначайте та розпізнавайте текст усіх популярних шрифтів і стилів.
Точне налаштування розпізнавання
Налаштуйте кожен параметр OCR для найкращих результатів розпізнавання.
Перевірка орфографії
Покращуйте результати, автоматично виправляючи слова з помилками.
Знайдіть текст на малюнках
Шукайте текст або регулярний вираз у наборі зображень.
Порівняйте тексти зображень
Порівняйте тексти на двох зображеннях, незалежно від регістру та компонування.
Зразки коду Python
Відкрийте для себе зразки коду, щоб легко інтегрувати Aspose.OCR для Python через Java у ваші програми.
Легке встановлення
Як пакет Python або файл для завантаження з мінімальними залежностями, Aspose.OCR для Python через Java забезпечує легке розповсюдження. Інтегруйте його у свій проект безпосередньо з Python, і ви будете готові використовувати повні можливості OCR, зберігаючи результати розпізнавання в різних форматах.
Після інсталяції негайно почніть використовувати Aspose.OCR для Python через Java, хоч і з певними обмеженнями. Тимчасова ліцензія знімає всі обмеження пробної версії на 30 днів. Використайте цей період, щоб розпочати розробку повнофункціональної програми OCR, яка дозволить вам пізніше прийняти обґрунтоване рішення щодо придбання Aspose.OCR для Python через Java.
Ліцензія на завантаження
lic = License()
lic.set_license(self.licPath)
Розпізнавання зображень
Основною проблемою в додатках OCR є дефіцит сканерів для кінцевих користувачів. Наш API, повністю інтегрований із Python через Java, має надійні вбудовані фільтри попередньої обробки зображень, які обробляють повернуті, перекошені та зашумлені зображення. У поєднанні з підтримкою всіх форматів зображень це дозволяє надійно розпізнавати навіть фотографії зі смартфона. Більшість процесів попередньої обробки та корекції зображень автоматизовані, тому ваше втручання потрібне лише у складних випадках.
Застосовувати автоматичні виправлення зображень - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Універсальний конвертер Python
Наш API вміло зчитує будь-яке зображення зі сканерів, камер або смартфонів: документи PDF, файли JPEG, PNG, TIFF, GIF, BMP. Повна підтримка багатосторінкових PDF-документів, зображень TIFF і DjVu забезпечує універсальність. Ви також можете надати зображення з Інтернету через URL-адресу.
Результати розпізнавання повертаються в популярних форматах документів і обміну даними: простий текст, PDF, Microsoft Word, Microsoft Excel, JSON і XML.
Розпізнавання PDF і збереження результатів у різних вихідних форматах - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Оптимізація використання ресурсів
OCR пропонує спеціальний алгоритм розпізнавання для вилучення вмісту із зображень із розрідженим текстом і шумним/кольоровим фоном. Цей метод значно покращує точність OCR у таких бізнес-кейсах:
- Прочитайте текст із вуличних фотографій.
- Сегментуйте та ідентифікуйте дорожні знаки та вивіски на зображеннях вулиць.
- Знайдіть цінники та інтерпретуйте витягнутий текст як ціни.
- Знайдіть і об’єднайте цікаві регіони на етикетках харчових продуктів, як-от інформацію про поживну цінність або списки інгредієнтів.
- Ідентифікувати та аналізувати номерні знаки автомобілів.
- Вилучення тексту з меню та каталогів.
Відкрита область OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Вилучення тексту з вуличних фотографій
OCR для Python пропонує спеціальний алгоритм розпізнавання, який витягує текст з номерних знаків автомобіля, включно з темними та розмитими фотографіями. Потім отриманий текст можна автоматично зберегти в базі даних або автоматично перевірити.
Розпізнай номер автомобіля - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)