کتابخانه OCR پایتون
با Python OCR تصاویر را به متن تبدیل کنید
ویترین های بیشتر ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
چرا Aspose.OCR برای پایتون از طریق دات نت؟
سفری را با Aspose OCR برای پایتون از طریق دات نت - یک OCR API همه کاره و کاربرپسند آغاز کنید. قابلیت OCR را با کمتر از 5 خط کد در برنامه های پایتون خود جاسازی کنید و نیاز به شبکه های پیچیده ریاضی یا عصبی را از بین ببرید. موتور قدرتمند OCR ما سرعت و دقت بی نظیری را ارائه می دهد و از بیش از 130 زبان از جمله انگلیسی، سیریلیک، عربی، فارسی، هندی، چینی، ژاپنی، کره ای، تامیل و بسیاری دیگر پشتیبانی می کند. چه تصاویر اسکن شده، عکس های گوشی هوشمند، اسکرین شات ها یا پی دی اف های اسکن شده، نتایج را در قالب های رایج اسناد و تبادل داده به دست آورید. از فیلترهای پیش پردازش برای مدیریت تصاویر چرخش، کج و نویز استفاده کنید.
OCR کارآمد و دقیق
سرعت و دقت بی نظیری را در نتایج OCR با فناوری پیشرفته پایتون تجربه کنید.
چند زبانه
تشخیص متن به بیش از 140 زبان: انگلیسی، فرانسوی، آلمانی، اسپانیایی، روسی، چینی، هندی، ژاپنی، کره ای، تامیلی، عربی، فارسی و غیره.
جهانی
با استفاده از پایتون، تصاویر را از منابع مختلف – اسکنر، دوربین و گوشی های هوشمند – به راحتی پردازش کنید.
زبان های آسیایی
دستیابی به تشخیص دقیق خطوط چینی، عربی، دوانگاری و دراویدی، و همچنین متون ترکیبی.
حفظ چیدمان
قالب بندی منبع را برای نمایش دقیق متن حفظ کنید و جداول را تشخیص دهید.
نمونه کد زنده
تبدیل تصویر به متن فقط در سه خط کد پایتون. برای خودت تلاش کن!
* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.
تبدیل تصویر به متن
نمونه های بیشتری را کشف کنید ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
ترجیح خود را انتخاب کنید
کتابخانه مناسب برای نیازهای خود را انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.
تطبیق پذیری
Python via .NET
یکنواختی
Python via Java
عملکرد
Python via C++
همه جا می دود
صرف نظر از نام، Aspose.OCR برای پایتون از طریق دات نت نیازی به نصب دات نت بر روی پلتفرم هدف ندارد. بسته نصب در حال حاضر با تمام اجزای مورد نیاز همراه است و می تواند به طور یکپارچه بر روی هر پلت فرمی کار کند - خواه ماشین محلی، وب سرور یا ابر.
فرمت های فایل پشتیبانی شده
Aspose.OCR for Python via .NET می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.
تصاویر
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR دسته ای
- Multi-page PDF
- DjVu
- ZIP
- Folder
نتایج شناسایی
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
نصب و راه اندازی
Aspose.OCR برای پایتون از طریق دات نت به عنوان یک بسته پایتون با حداقل وابستگی یا به صورت فایل قابل دانلود یا [بسته PyPI](https: //pypi.org/project/aspose-ocr-python-net/). به راحتی آن را در پروژه خود نصب کنید و آماده تشخیص متون به بیش از 140 زبان و ذخیره نتایج تشخیص در قالبهای مختلف هستید.
درخواست مجوز آزمایشی برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی بدون محدودیت.
OCR تحت پایتون
کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا به طور یکپارچه بر روی هر پلتفرمی اجرا شوند - ویندوز دسکتاپ، ویندوز سرور، macOS، لینوکس و ابر.
140+ زبان تشخیص
کتابخانه Java OCR ما یک راه حل جهانی برای پردازش اسناد، استخراج داده ها و دیجیتالی کردن محتوا در مقیاس جهانی است. با پشتیبانی از مجموعه گسترده ای از اسکریپت های نوشتاری اروپایی، خاورمیانه و آسیایی، برای هر کشور و تجارتی به خوبی سازگار است.
Aspose OCR برای جاوا متن را در اسناد چند زبانه مانند چینی/انگلیسی، عربی/فرانسوی یا سیریلیک/انگلیسی تشخیص میدهد. زبان های زیر پشتیبانی می شوند:
- ** لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
- ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، بلغاری، از جمله متون ترکیبی سیریلیک/انگلیسی.
- عربی، فارسی، اردو، از جمله متون آمیخته با انگلیسی.
- زبان های چینی، کره ای، ژاپنی، دوانگاری و دراویدی، از جمله هندی، تامیل، مراتی و غیره. متون به زبان ترکیبی نیز پشتیبانی می شوند.
فیلترهای پردازشی قدرتمند
دقت و قابلیت اطمینان تشخیص کاراکتر نوری به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose OCR برای پایتون از طریق دات نت تعداد زیادی فیلتر پردازش تصویر کاملاً خودکار و دستی را ارائه می دهد که تصویر را قبل از ارسال به موتور OCR بهبود می بخشد:
- چرخش خودکار تصاویر وارونه و چرخانده شده.
- تشخیص تصاویر معکوس و استخراج متن سفید روی سیاه.
- به طور خودکار کثیفی، لکه ها، خراش ها، تابش خیره کننده، گرادیان های ناخواسته و سایر صداها را حذف کنید.
- کنتراست تصویر را به صورت خودکار تنظیم کنید.
- تصویر را به صورت خودکار ارتقا دهید یا اندازه آن را به صورت دستی تغییر دهید.
- تصاویر را به سیاه و سفید یا خاکستری تبدیل کنید.
- مناطق بالقوه مشکل ساز تصویر را پیدا کنید و اطلاعات مربوط به نوع نقص و مختصات آن را برگردانید.
- ضخامت کاراکترها را در یک تصویر افزایش دهید.
- با حفظ لبه های حروف، تصاویر پر سر و صدا را تار کنید.
- انحنای صفحه را صاف کنید و اعوجاج لنز دوربین را برای عکس های صفحه برطرف کنید.
برای انواع اسناد خاص بهینه شده است
Aspose OCR برای پایتون از طریق دات نت شبکه های عصبی آموزش دیده ای را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:
غلطگیر املای داخلی
اگرچه کتابخانه Python OCR ما دقت تشخیص بالایی را ارائه میکند، نقص چاپ، کثیفی یا فونتهای غیر استاندارد ممکن است باعث شود برخی از کاراکترها یا کلمات به اشتباه تشخیص داده شوند. برای بهبود بیشتر نتایج تشخیص، میتوانید غلطگیر املا را روشن کنید، که خطاهای املایی را براساس زبان تشخیص انتخابشده پیدا کرده و بهطور خودکار تصحیح میکند.
اگر متن شناسایی شده حاوی اصطلاحات تخصصی، اختصارات و کلمات دیگری است که در فرهنگ لغت های املایی رایج وجود ندارد، می توانید فهرست کلمات خود را ارائه دهید.
تشخیص دسته
Python OCR API شما را از تشخیص تک تک تصاویر آزاد می کند. از روشهای مختلف پردازش دستهای برای تشخیص چندین تصویر در یک تماس استفاده کنید:
- تشخیص فایل های PDF چند صفحه ای، TIFF و DjVu.
- شناسایی تمامی فایل های موجود در یک پوشه
- تشخیص تمام فایل های موجود در یک آرشیو.
- تشخیص همه فایل ها از یک لیست.
یادگیری با نمونه
OCR برای پایتون آرایهای از نمونهها را ارائه میکند که در پایتون نوشته شدهاند و به شما این امکان را میدهند که به سرعت خود را با عملکردها و قابلیتهای آن آشنا کنید. برای ایجاد راهحلهای مناسب برای رفع نیازهای تجاری پایتون خود، بینشهایی به دست آورید.
ویژگی ها و قابلیت ها
Aspose.OCR for Python via .NET وظایف شما را سریع و آسان حل می کند.
عکس OCR
استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.
PDF قابل جستجو
هر اسکن را به یک سند کاملاً قابل جستجو، فهرستبندی و قابل ویرایش تبدیل کنید.
تشخیص URL
تشخیص تصویر از URL بدون بارگیری محلی.
تشخیص انبوه
تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.
هر نوع فونت و سبک
متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.
تشخیص دقیق
هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.
غلط گیر املا
با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.
متن را در تصاویر پیدا کنید
متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.
متن های تصویری را با هم مقایسه کنید
متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.
نمونه کدهای پایتون
برای ادغام یکپارچه OCR در برنامههای پایتون خود، نمونههای کد را بررسی کنید.
نصب و راه اندازی
Aspose.OCR برای Python از طریق دات نت که به عنوان یک چرخ پایتون یا بسته قابل دانلود مستقل توزیع شده است، به راحتی توزیع می شود. ادغام در پروژه پایتون شما، مستقیماً از محیط توسعه یکپارچه پایتون (IDE) یک فرآیند یکپارچه است. به سادگی آن را نصب کنید، و شما آماده هستید تا از طیف کاملی از قابلیت های OCR استفاده کنید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.
پس از نصب، می توانید بلافاصله از طریق دات نت استفاده از Aspose.OCR برای پایتون را شروع کنید. ، البته با محدودیت های خاصی. یک مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز برمی دارد. از این دوره برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد در مرحله بعد تصمیمی آگاهانه در مورد خرید Aspose.OCR برای Python از طریق دات نت بگیرید.
مجوز بارگیری
lic = License()
lic.set_license(self.licPath)
تشخیص متن روی عکس ها
خواندن متن از هر محتوایی در Aspose OCR برای پایتون به آسانی فراخوانی یک روش تشخیص جهانی است.
تبدیل عکس به متن - پایتون
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
مبدل جهانی پایتون
API ما هر تصویری را از اسکنرها، دوربینها یا گوشیهای هوشمند میخواند: اسناد PDF، JPEG، PNG، TIFF، GIF، تصاویر BMP و حتی فایلهای DjVu. پشتیبانی کامل از اسناد PDF چند صفحه ای، تصاویر TIFF و DjVu تطبیق پذیری را تضمین می کند. شما همچنین می توانید یک تصویر از وب از طریق یک URL ارائه دهید.
نتایج تشخیص در قالبهای رایج تبادل اسناد و دادهها برگردانده میشود: متن ساده، PDF، Microsoft Word، Microsoft Excel، JSON، و XML.
PDF را بشناسید و نتایج را در فرمت های خروجی مختلف ذخیره کنید - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
بهینه سازی منابع در پایتون
تشخیص نوری کاراکتر به منابع نیاز دارد. API ما راههای انعطافپذیری را برای متعادل کردن سه گانه کلاسیک زمان-قیمت-کیفیت ارائه میدهد:
- بین تشخیص کامل و تشخیص سریع یکی را انتخاب کنید.
- تعداد رشته های اختصاص داده شده برای شناسایی را مشخص کنید، یا به کتابخانه اجازه دهید تا به طور خودکار به تعداد هسته های پردازنده مقیاس شود.
- با بارگذاری محاسبات در باطن دات نت، CPU را آزاد کنید.
تشخیص سریع - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
تک خط را بشناسید
اگر تصویر شما از قبل به یک خط متن بریده شده است، می توان آن را در سریع ترین حالت ممکن، بدون اصلاحات خودکار، تشخیص ساختار محتوا و سایر مراحل مصرف کننده منابع، تشخیص داد. می تواند سرعت OCR را تا 7 برابر سریعتر از فرآیند تشخیص عادی افزایش دهد.
تشخیص تک خط متن روی تصویر - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)