کتابخانه Python OCR
تبدیل تصاویر به متن با Python OCR
ویترین بیشتر ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
چرا Aspose.ocr for Python از طریق .NET؟
سفر با Aspose OCR را برای Python از طریق .NET-یک API OCR همه کاره و کاربر پسند. عملکرد OCR را در برنامه های Python خود با کمتر از 5 خط کد جاسازی کرده و نیاز به شبکه های پیچیده ریاضی یا عصبی را از بین می برد. موتور قدرتمند OCR ما سرعت و دقت بی نظیری را ارائه می دهد و از 140+ زبان از جمله انگلیسی ، سیریلیک ، عربی ، فارسی ، هندی ، چینی ، ژاپنی ، کره ای ، تامیل و موارد دیگر پشتیبانی می کند. چه تصاویر اسکن شده ، عکس های تلفن های هوشمند ، تصاویر ، یا PDF های اسکن شده ، در قالب های محبوب اسناد و تبادل داده ها به دست می آورند. فیلترهای پیش پردازش را برای کنترل تصاویر چرخان ، چرب و پر سر و صدا اهرم کنید.

OCR کارآمد و دقیق
سرعت و دقت بی نظیر را در نتایج OCR با فناوری پیشرفته پایتون تجربه کنید.
چند زبانه
متن را به زبان 140+ بشناسید: انگلیسی ، فرانسوی ، آلمانی ، اسپانیایی ، روسی ، چینی ، هندی ، ژاپنی ، کره ای ، تامیل ، عربی ، فارسی و موارد دیگر.
جهانی
با استفاده از پایتون ، تصاویر را از منابع متنوع - اسکنرها ، دوربین ها و تلفن های هوشمند پردازش کنید.
زبانهای آسیایی
به رسمیت شناختن دقیق اسکریپت های چینی ، عربی ، Devanagari و Dravidian و همچنین متون به زبان مختلط دست یابید.
چیدمان حفظ
قالب بندی منبع را برای نمایش دقیق متن حفظ کنید و جداول را تشخیص دهید.
نمونه کد زنده
فقط در سه خط کد پایتون یک تصویر را به متن تبدیل کنید. خودتان را امتحان کنید!
* با بارگذاری پرونده های خود یا استفاده از خدماتی که با ما موافق هستید شرایط استفاده وت سیاست حفظ حریم.
تبدیل تصویر به متن
نمونه های بیشتری را کشف کنید ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
اولویت خود را انتخاب کنید
کتابخانه مناسب را برای نیازهای خود انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.
تطبیق پذیری
Python via .NET
یکسان بودن
Python via Java
عمل
Python via C++
همه جا اجرا می شود
صرف نظر از نام ، aspose.ocr for Python از طریق .NET نیازی به نصب .NET در سکوی هدف ندارد. بسته نصب در حال حاضر با کلیه مؤلفه های مورد نیاز همراه است و می تواند یکپارچه بر روی هر سیستم عامل کار کند - خواه یک دستگاه محلی ، سرور وب یا ابر باشد.
قالب های فایل پشتیبانی شده
Aspose.OCR for Python via .NET می تواند با هر [پرونده]کار کند( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد ، به یک پایگاه داده وارد کرد یا در زمان واقعی مورد تجزیه و تحلیل قرار گرفت.
تصاویر
- JPEG
- PNG
- TIFF
- BMP
- GIF
دسته OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
نتایج تشخیص
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
نصب
Aspose.ocr for Python از طریق .NET به عنوان یک بسته پایتون با حداقل وابستگی یا به عنوان یک پرونده قابل بارگیری یا pypi بسته تحویل داده می شود. به راحتی نصب آن را وارد پروژه خود کنید ، و شما آماده هستید تا متون را به زبان 140+ بشناسید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.
درخواست مجوز آزمایشی برای شروع توسعه یک برنامه OCR کاملاً کاربردی و بدون محدودیت.
OCR تحت پایتون
کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا یکپارچه بر روی هر سیستم عامل اجرا شوند - دسک تاپ ویندوز ، ویندوز سرور ، مکوس ، لینوکس و ابر.
140+ زبان تشخیص
کتابخانه Java OCR ما یک راه حل جهانی برای پردازش اسناد ، استخراج داده ها و دیجیتالی شدن محتوا در مقیاس جهانی است. با حمایت از طیف گسترده ای از اسکریپت های نوشتن اروپایی ، خاورمیانه و آسیایی ، برای هر کشور و تجارت سازگار است.
به عنوان OCR برای جاوا متن را در اسناد چند زبانه مانند چینی/انگلیسی ، عربی/فرانسوی یا سیریلیک/انگلیسی به رسمیت می شناسد. زبانهای زیر پشتیبانی می شوند:
- ** گسترش یافته لاتین **: انگلیسی ، اسپانیایی ، فرانسوی ، اندونزی ، پرتغالی ، آلمانی ، ویتنامی ، ترکی ، ایتالیایی ، لهستانی و 80+ بیشتر.
- ** سیریلیک ** الفبای: روسی ، اوکراینی ، قزاق ، بلغاری ، از جمله متون مخلوط سیریلیک/انگلیسی.
- عربی ، فارسی ، اردو ، از جمله متون مخلوط با انگلیسی.
- زبان های چینی ، کره ای ، ژاپنی ، Devanagari و Dravidian ، از جمله هندی ، تامیل ، مراتی و دیگران. متون به زبان مختلط نیز پشتیبانی می شوند.
فیلترهای پردازش قدرتمند
صحت و قابلیت اطمینان تشخیص شخصیت نوری به کیفیت تصویر اصلی وابسته است. به عنوان OCR برای پایتون از طریق .NET تعداد زیادی از فیلترهای پردازش کاملاً خودکار و دستی را ارائه می دهد که قبل از ارسال به موتور OCR یک تصویر را تقویت می کند:
- به طور خودکار تصاویر وارونه و چرخان را بچرخانید.
- تصاویر معکوس را تشخیص داده و متن سفید روی سیاه را استخراج کنید.
- به طور خودکار خاک ، لکه ها ، خراش ها ، تابش خیره کننده ، شیب ناخواسته و سایر سر و صدای را از بین ببرید.
- کنتراست تصویر را بطور خودکار تنظیم کنید.
- به صورت خودکار مجلل ، یا به صورت دستی تصویر را تغییر اندازه دهید.
- تصاویر را به مقیاس سیاه و سفید یا خاکستری تبدیل کنید.
- مناطق بالقوه مشکل ساز تصویر را پیدا کرده و اطلاعات را در مورد نوع نقص و مختصات آن برگردانید.
- ضخامت شخصیت ها را در یک تصویر افزایش دهید.
- تصاویر پر سر و صدا هنگام حفظ لبه های حروف.
- انحراف صفحه را صاف کرده و اعوجاج لنز دوربین را برای عکس های صفحه اصلاح کنید.
برای انواع خاص سند بهینه شده است
به عنوان OCR برای پایتون از طریق .NET شبکه های عصبی ویژه آموزش دیده را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:
داخلی طلسم داخلی
اگرچه کتابخانه Python OCR ما صحت شناخت بالایی را ارائه می دهد ، نقص چاپ ، خاک یا قلم های غیر استاندارد ممکن است باعث شود شخصیت ها یا کلمات خاصی نادرست شناخته شوند. برای بهبود بیشتر نتایج تشخیص ، می توانید طلسم را روشن کنید ، که خطاهای املایی را بر اساس زبان تشخیص انتخاب شده پیدا کرده و به طور خودکار اصلاح می کند.
اگر متن شناخته شده حاوی اصطلاحات تخصصی ، اختصارات و کلمات دیگر باشد که در فرهنگ لغت های املایی مشترک وجود ندارد ، می توانید لیست های کلمه خود را ارائه دهید.
شناخت دسته
Python OCR API ما شما را از شناخت تصاویر یک به یک آزاد می کند. از روشهای مختلف پردازش دسته ای استفاده کنید تا چندین تصویر را در یک تماس تشخیص دهید:
- به رسمیت شناختن پرونده های PDF ، TIFF و DJVU چند صفحه ای.
- شناخت همه پرونده ها در یک پوشه.
- شناخت همه پرونده ها در یک بایگانی.
- شناخت همه پرونده ها از یک لیست.
یادگیری توسط نمونه
OCR برای Python مجموعه ای از نمونه ها را که در پایتون نوشته شده است ، فراهم می کند و به شما امکان می دهد تا خود را با عملکرد و توانایی های خود به سرعت آشنا کنید. برای ایجاد راه حل های متناسب برای پاسخگویی به نیازهای تجاری پایتون ، بینش کسب کنید.
ویژگی ها و قابلیت ها
Aspose.OCR for Python via .NET Aspose.ocr for Python از طریق .NET وظایف شما را سریع و آسان حل می کند.
عکس OCR
متن را از عکس های تلفن هوشمند با دقت در سطح اسکن استخراج کنید.
PDF قابل جستجو
هر اسکن را به یک سند کاملاً قابل جستجو ، شاخص و قابل ویرایش تبدیل کنید.
شناخت URL
بدون بارگیری در محلی ، تصویری را از URL تشخیص دهید.
شناخت انبوه
تمام تصاویر را از اسناد ، پوشه ها و بایگانی های چند صفحه ای بخوانید.
هر قلم و سبک
متن را در همه نوع و سبک های محبوب شناسایی و تشخیص دهید.
شناخت تنظیم دقیق
هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.
طلسم طلسم
با اصلاح خودکار کلمات غلط املایی ، نتایج را بهبود بخشید.
متن را در تصاویر پیدا کنید
متن یا بیان منظم را در مجموعه ای از تصاویر جستجو کنید.
متون تصویر را مقایسه کنید
متون را بدون در نظر گرفتن مورد و چیدمان بر روی دو تصویر مقایسه کنید.
نمونه کد پایتون
برای ادغام یکپارچه OCR در برنامه های پایتون خود ، نمونه های کد را وارد کنید.
نصب
توزیع شده به عنوان یک چرخ پایتون یا بسته قابل بارگیری خود ، Aspose.ocr for Python از طریق .NET به راحتی توزیع می شود. ادغام در پروژه Python شما ، مستقیماً از محیط توسعه یکپارچه Python Python (IDE) ، یک فرایند یکپارچه است. به سادگی آن را نصب کنید ، و شما آماده هستید تا از طیف کاملی از قابلیت های OCR استفاده کنید ، و نتایج تشخیص را در قالب های مختلف صرفه جویی می کنید. مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز بلند می کند. از این دوره برای شروع توسعه یک برنامه OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد تصمیم آگاهانه ای در مورد خرید Aspose.ocr برای Python از طریق .NET در مرحله بعدی بگیرید.
مجوز بار
lic = License()
lic.set_license(self.licPath)
متن را در عکس ها تشخیص دهید
خواندن متن از هر محتوا در Aspose OCR برای Python به آسانی است که یک روش تشخیص جهانی را فراخوانی می کند.
تبدیل عکس به متن - پایتون
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
مبدل جهانی پایتون
API ما به طور دقیق هر تصویری را از اسکنرها ، دوربین ها یا تلفن های هوشمند می خواند: اسناد PDF ، JPEG ، PNG ، TIFF ، GIF ، تصاویر BMP و حتی پرونده های DJVU. پشتیبانی کامل از اسناد PDF چند صفحه ای ، تصاویر TIFF و DJVU تطبیق پذیری را تضمین می کند. همچنین می توانید از طریق URL تصویری از وب ارائه دهید.
نتایج تشخیص در قالب های محبوب اسناد و تبادل داده بازگردانده می شود: متن ساده ، PDF ، Microsoft Word ، Microsoft Excel ، JSON و XML.
PDF را بشناسید و نتایج را در قالب های مختلف خروجی ذخیره کنید - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
بهینه سازی منابع در پایتون
تشخیص شخصیت نوری منابع را می طلبد. API ما روشهای انعطاف پذیر برای تعادل سه گانه با کیفیت قیمت کلاسیک ارائه می دهد:
- بین شناخت کامل و شناخت سریع را انتخاب کنید.
- تعداد موضوعات اختصاص یافته برای تشخیص را مشخص کنید ، یا به کتابخانه اجازه دهید به طور خودکار به تعداد هسته های پردازنده مقیاس بندی کند.
- CPU را با بارگذاری محاسبات به باطن .NET آزاد کنید.
شناخت سریع - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
تک خط را تشخیص دهید
اگر تصویر شما از قبل به یک خط متن تبدیل شده است ، می توان در سریعترین حالت ممکن ، بدون اصلاحات خودکار ، تشخیص ساختار محتوا و سایر مراحل مصرف کننده منابع شناخته شد. این می تواند OCR را تا 7 برابر سریعتر از فرآیند تشخیص عادی سرعت بخشد.
یک خط متن را روی تصویر تشخیص دهید - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)