Майстерність OCR у Python: на основі Aspose.OCR для Python через .NET
OCR: перетворюйте зображення на текст за допомогою Python
Більше вітрин ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Чому варто вибрати Aspose.OCR для Python через .NET?
Вирушайте в подорож з Aspose.OCR для Python через .NET – універсальним і зручним OCR API. Вбудуйте функції оптичного розпізнавання символів у свої програми Python за допомогою менше ніж 5 рядків коду, усуваючи потребу у складних математичних чи нейронних мережах. Наш потужний механізм OCR забезпечує неперевершену швидкість і точність, підтримуючи 28 мов, у тому числі латиницю, кирилицю та китайську. Будь то відскановані зображення, фотографії зі смартфона, знімки екрана чи відскановані PDF-файли, отримуйте результати в популярних форматах обміну документами та даними. Використовуйте фільтри попередньої обробки для обробки повернутих, перекошених і зашумлених зображень. Оптимізуйте продуктивність розпізнавання та навантаження на систему, переклавши ресурсомісткі завдання на серверну частину .NET.
Ефективне та точне володіння OCR
Відчуйте неперевершену швидкість і точність результатів оптичного розпізнавання символів завдяки передовій технології Python і .NET.
Багатомовна досконалість
Легко й точно розпізнавайте текст 28 мовами, включно з латиницею, кирилицею та китайською.
Адаптивна обробка зображень
Легко обробляйте зображення з різних джерел – сканерів, камер і смартфонів – за допомогою Python і .NET.
Володіння китайськими ієрогліфами
Досягніть точного розпізнавання понад 6000 китайських ієрогліфів, забезпечуючи точність за допомогою Python і .NET.
Збереження стилів і форматів шрифтів
Підтримуйте стилі шрифтів і форматування для точного представлення тексту, підвищуючи універсальність за допомогою Python і .NET.
Приклад живого коду
Відчуйте простоту: перетворіть зображення на текст лише за три рядки коду Python!
* Завантажуючи свої файли або користуючись сервісом, ви погоджуєтеся з нашими Умови використання і Політика конфіденційності.
Перетворення зображення на текст
Дізнайтеся більше прикладів ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Виберіть платформу
Виберіть бібліотеку, яка найкраще підходить для ваших потреб.
Гнучкість
Python via .NET
Універсальність
Python via Java
Швидкість
Python via C++
Розширення можливостей .NET для Python у кожному кутку
Aspose.OCR для Python через .NET бездоганно працює на будь-якій платформі, що підтримує .NET Framework 4.0 і пізніших версій – будь то локальна машина, веб сервер або хмара.
Підтримувані формати файлів
Aspose.OCR for Python via .NET може працювати практично з будь-яким файлом можна отримати зі сканера або камери. Результати розпізнавання повертаються в найпопулярніших форматах обміну файлами та даними, які можна зберігати, імпортувати до бази даних або аналізувати в реальному часі.
Зображення
- JPEG
- PNG
- TIFF
- BMP
- GIF
Пакетне OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Результати розпізнавання
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Інсталяція для Python із серверною частиною .NET
Aspose.OCR для Python через .NET поставляється як пакет Python із мінімальними залежностями або як файл для завантаження . Легко встановіть його у свій проект, і ви готові розпізнавати тексти кількома підтримуваними мовами та зберігати результати розпізнавання в різних форматах.
Подайте запит на пробну ліцензію , щоб розпочати розробку повнофункціональної програми OCR без обмежень.
Потужне OCR для програм Python
Наша бібліотека легко інтегрується, дозволяючи програмам Python безперебійно працювати на будь-якій платформі – Windows, Windows Server, macOS, Linux і хмарі.
28 Мови розпізнавання
Наш API OCR для Python і .NET розпізнає безліч мов і популярних сценаріїв написання, включаючи змішані мови:
Залиште визначення мови бібліотеці або визначте мову самостійно для підвищення продуктивності та надійності розпізнавання.
- Розширена латиниця: хорватська, чеська, датська, голландська, англійська, естонська, фінська, французька, німецька, італійська, латвійська, литовська, норвезька, польська, португальська, румунська, словацька, словенська, іспанська, шведська;
- кирилиця: білоруська, болгарська, казахська, російська, сербська, українська;
- китайська: понад 6000 символів;
- Хінді.
Потужні фільтри обробки
Точність і надійність оптичного розпізнавання символів сильно залежить від якості вихідного зображення. Aspose.OCR для Python через .NET пропонує велику кількість повністю автоматизованих і ручних фільтрів обробки зображень, які покращують зображення перед його надсиланням до механізму OCR:
- Автоматично вирівнюйте зображення, вирівняні під невеликим кутом до горизонталі.
- Повертайте вручну сильно спотворені зображення.
- Автоматично видаляйте бруд, плями, подряпини, відблиски, небажані градієнти та інші шуми.
- Автоматичне налаштування контрастності зображення.
- Автоматично збільшити або вручну змінити розмір зображення.
- Перетворення зображень на чорно-біле або в градаціях сірого.
- Інвертуйте кольори зображення так, щоб світлі ділянки виглядали темними, а темні — світлими.
- Збільште товщину символів на зображенні.
- Розмити шумні зображення, зберігаючи краї літер.
- Вирівняйте кривизну сторінки та виправте спотворення об’єктива камери для фотографій на сторінці.
Оптимізовано для певних типів документів
Aspose.OCR для Python через .NET пропонує спеціально навчені нейронні мережі для вилучення тексту з певних типів зображень із максимальною точністю:
Вбудована перевірка орфографії
Хоча Aspose.OCR для Python через .NET забезпечує високу точність розпізнавання, дефекти друку, бруд або нестандартні шрифти можуть призвести до неправильного розпізнавання певних символів або слів. Щоб ще більше покращити результати розпізнавання, ви можете ввімкнути перевірку орфографії, яка знаходить і автоматично виправляє орфографічні помилки на основі вибраної мови розпізнавання.
Якщо розпізнаний текст містить спеціальну термінологію, абревіатури та інші слова, яких немає в загальноприйнятих орфографічних словниках, ви можете надати власні списки слів.
Спрощене розпізнавання пакетів
Наш API OCR Python звільняє вас від розпізнавання зображень одне за одним. Використовуйте різні методи пакетної обробки для розпізнавання кількох зображень за один виклик:
- Розпізнавання багатосторінкових файлів PDF, TIFF і DjVu.
- Розпізнавання всіх файлів у папці.
- Розпізнавання всіх файлів в архіві.
- Розпізнавання всіх файлів зі списку.
Навчання на прикладах Python
Aspose.OCR для Python через .NET надає масив прикладів , написаних на Python, що дозволяє швидко ознайомитися з його функціями і можливості. Отримайте знання для створення індивідуальних рішень для задоволення потреб вашого бізнесу на Python.
Особливості та можливості
Aspose.OCR for Python via .NET Ознайомтеся з розширеними можливостями Aspose.OCR для C++.
Фото OCR
Витягуйте текст із фотографій смартфона з точністю сканування.
PDF з можливістю пошуку
Перетворюйте будь-яке скановане зображення на документ із можливістю пошуку та індексування.
розпізнавання URL
Розпізнайте зображення за URL-адресою, не завантажуючи його локально.
Масове розпізнавання
Читайте всі зображення з багатосторінкових документів, папок і архівів.
Будь-який шрифт і стиль
Визначайте та розпізнавайте текст усіх популярних шрифтів і стилів.
Точне налаштування розпізнавання
Налаштуйте кожен параметр OCR для найкращих результатів розпізнавання.
Перевірка орфографії
Покращуйте результати, автоматично виправляючи слова з помилками.
Знайдіть текст на малюнках
Шукайте текст або регулярний вираз у наборі зображень.
Порівняйте тексти зображень
Порівняйте тексти на двох зображеннях, незалежно від регістру та компонування.
Зразки коду Python
Ознайомтеся зі зразками коду, щоб легко інтегрувати Aspose.OCR для Python через .NET у ваші програми Python.
Майстерність встановлення на Python
Aspose.OCR для Python через .NET легко розповсюджується як Python Wheel або автономний пакет для завантаження. Інтеграція у ваш проект Python безпосередньо з інтегрованого середовища розробки Python (IDE) є безперебійним процесом. Просто встановіть його, і ви готові використовувати повний спектр можливостей OCR, зберігаючи результати розпізнавання в різних форматах.
Після встановлення ви можете негайно почати використовувати Aspose.OCR для Python через .NET , хоча й з певними обмеженнями. Тимчасова ліцензія скасовує всі обмеження пробної версії на 30 днів. Використайте цей період, щоб розпочати розробку повнофункціональної програми OCR, яка дозволить вам прийняти обґрунтоване рішення щодо придбання Aspose.OCR для Python через .NET на пізнішому етапі.
Ліцензія на завантаження
lic = License()
lic.set_license(self.licPath)
Розпізнавайте текст на фотографіях
Читання тексту з будь-якого вмісту в Aspose.OCR для Python через .NET так само просто, як виклик універсального методу розпізнавання ().
Перетворення фотографії в текст - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Універсальний конвертер Python
Наш API вміло зчитує будь-які зображення зі сканерів, камер або смартфонів: документи PDF, JPEG, PNG, TIFF, GIF, зображення BMP і навіть файли DjVu. Повна підтримка багатосторінкових PDF-документів, зображень TIFF і DjVu забезпечує універсальність. Ви також можете надати зображення з Інтернету через URL-адресу.
Результати розпізнавання повертаються в популярних форматах документів і обміну даними: простий текст, PDF, Microsoft Word, Microsoft Excel, JSON і XML.
Розпізнавання PDF і збереження результатів у різних вихідних форматах - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Оптимізація ресурсів у Python
Оптичне розпізнавання символів вимагає ресурсів. Наш API пропонує гнучкі способи збалансувати класичну тріаду час-ціна-якість:
- Вибирайте між ретельним розпізнаванням і швидким розпізнаванням.
- Укажіть кількість потоків, призначених для розпізнавання, або дозвольте бібліотеці автоматично масштабуватись відповідно до кількості ядер процесора.
- Звільніть центральний процесор, перевантаживши обчислення на серверну частину .NET.
Швидке розпізнавання - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Розпізнати один рядок
Якщо ваше зображення вже обрізано до одного рядка тексту, його можна розпізнати в найшвидшому режимі без автоматичних виправлень, визначення структури вмісту та інших ресурсозатратних кроків. Він може пришвидшити OCR до 7 разів швидше, ніж звичайний процес розпізнавання.
Розпізнавати один рядок тексту на зображенні - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)