چرا Aspose.OCR برای پایتون از طریق دات نت؟

سفری را با Aspose OCR برای پایتون از طریق دات نت - یک OCR API همه کاره و کاربرپسند آغاز کنید. قابلیت OCR را با کمتر از 5 خط کد در برنامه های پایتون خود جاسازی کنید و نیاز به شبکه های پیچیده ریاضی یا عصبی را از بین ببرید. موتور قدرتمند OCR ما سرعت و دقت بی نظیری را ارائه می دهد و از بیش از 130 زبان از جمله انگلیسی، سیریلیک، عربی، فارسی، هندی، چینی، ژاپنی، کره ای، تامیل و بسیاری دیگر پشتیبانی می کند. چه تصاویر اسکن شده، عکس های گوشی هوشمند، اسکرین شات ها یا پی دی اف های اسکن شده، نتایج را در قالب های رایج اسناد و تبادل داده به دست آورید. از فیلترهای پیش پردازش برای مدیریت تصاویر چرخش، کج و نویز استفاده کنید.

Illustration ocr

OCR کارآمد و دقیق

سرعت و دقت بی نظیری را در نتایج OCR با فناوری پیشرفته پایتون تجربه کنید.

چند زبانه

تشخیص متن به بیش از 140 زبان: انگلیسی، فرانسوی، آلمانی، اسپانیایی، روسی، چینی، هندی، ژاپنی، کره ای، تامیلی، عربی، فارسی و غیره.

جهانی

با استفاده از پایتون، تصاویر را از منابع مختلف – اسکنر، دوربین و گوشی های هوشمند – به راحتی پردازش کنید.

زبان های آسیایی

دستیابی به تشخیص دقیق خطوط چینی، عربی، دوانگاری و دراویدی، و همچنین متون ترکیبی.

حفظ چیدمان

قالب بندی منبع را برای نمایش دقیق متن حفظ کنید و جداول را تشخیص دهید.

نمونه کد زنده

تبدیل تصویر به متن فقط در سه خط کد پایتون. برای خودت تلاش کن!

آماده تشخیص آماده تشخیص یک فایل را اینجا رها کنید یا برای مرور کلیک کنید *

* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.

نتیجه شناخت
 
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

ترجیح خود را انتخاب کنید

کتابخانه مناسب برای نیازهای خود را انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.

تطبیق پذیری

Python via .NET

توسعه آسان، خوانایی و قابلیت نگهداری کد
دارای بیشترین ویژگی ها و دریافت اغلب به روز رسانی
سرعت کلی ممکن است کمی کندتر از سایر سیستم عامل ها باشد

یکنواختی

Python via Java

از همان کتابخانه در هر پلتفرمی استفاده کنید
برنامه خود را به طور یکپارچه بر روی هر دستگاهی اجرا کنید
به Java Runtime Environment (JRE) نسخه 8 یا بالاتر نیاز دارد

عملکرد

Python via C++

سریع ترین سرعت ممکن صرف نظر از پلت فرم
کنترل زیادی بر مدیریت منابع
برای توسعه دهندگان با تجربه هدف گذاری شده است

همه جا می دود

صرف نظر از نام، Aspose.OCR برای پایتون از طریق دات نت نیازی به نصب دات نت بر روی پلتفرم هدف ندارد. بسته نصب در حال حاضر با تمام اجزای مورد نیاز همراه است و می تواند به طور یکپارچه بر روی هر پلت فرمی کار کند - خواه ماشین محلی، وب سرور یا ابر.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

فرمت های فایل پشتیبانی شده

Aspose.OCR for Python via .NET می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.

تصاویر

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR دسته ای

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتایج شناسایی

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

نصب و راه اندازی

Aspose.OCR برای پایتون از طریق دات نت به عنوان یک بسته پایتون با حداقل وابستگی یا به صورت فایل قابل دانلود یا [بسته PyPI](https: //pypi.org/project/aspose-ocr-python-net/). به راحتی آن را در پروژه خود نصب کنید و آماده تشخیص متون به بیش از 140 زبان و ذخیره نتایج تشخیص در قالب‌های مختلف هستید.

درخواست مجوز آزمایشی برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی بدون محدودیت.

OCR تحت پایتون

کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا به طور یکپارچه بر روی هر پلتفرمی اجرا شوند - ویندوز دسکتاپ، ویندوز سرور، macOS، لینوکس و ابر.

140+ زبان تشخیص

کتابخانه Java OCR ما یک راه حل جهانی برای پردازش اسناد، استخراج داده ها و دیجیتالی کردن محتوا در مقیاس جهانی است. با پشتیبانی از مجموعه گسترده ای از اسکریپت های نوشتاری اروپایی، خاورمیانه و آسیایی، برای هر کشور و تجارتی به خوبی سازگار است.

Aspose OCR برای جاوا متن را در اسناد چند زبانه مانند چینی/انگلیسی، عربی/فرانسوی یا سیریلیک/انگلیسی تشخیص می‌دهد. زبان های زیر پشتیبانی می شوند:

  • ** لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
  • ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، بلغاری، از جمله متون ترکیبی سیریلیک/انگلیسی.
  • عربی، فارسی، اردو، از جمله متون آمیخته با انگلیسی.
  • زبان های چینی، کره ای، ژاپنی، دوانگاری و دراویدی، از جمله هندی، تامیل، مراتی و غیره. متون به زبان ترکیبی نیز پشتیبانی می شوند.

فیلترهای پردازشی قدرتمند

دقت و قابلیت اطمینان تشخیص کاراکتر نوری به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose OCR برای پایتون از طریق دات نت تعداد زیادی فیلتر پردازش تصویر کاملاً خودکار و دستی را ارائه می دهد که تصویر را قبل از ارسال به موتور OCR بهبود می بخشد:

  • چرخش خودکار تصاویر وارونه و چرخانده شده.
  • تشخیص تصاویر معکوس و استخراج متن سفید روی سیاه.
  • به طور خودکار کثیفی، لکه ها، خراش ها، تابش خیره کننده، گرادیان های ناخواسته و سایر صداها را حذف کنید.
  • کنتراست تصویر را به صورت خودکار تنظیم کنید.
  • تصویر را به صورت خودکار ارتقا دهید یا اندازه آن را به صورت دستی تغییر دهید.
  • تصاویر را به سیاه و سفید یا خاکستری تبدیل کنید.
  • مناطق بالقوه مشکل ساز تصویر را پیدا کنید و اطلاعات مربوط به نوع نقص و مختصات آن را برگردانید.
  • ضخامت کاراکترها را در یک تصویر افزایش دهید.
  • با حفظ لبه های حروف، تصاویر پر سر و صدا را تار کنید.
  • انحنای صفحه را صاف کنید و اعوجاج لنز دوربین را برای عکس های صفحه برطرف کنید.

برای انواع اسناد خاص بهینه شده است

Aspose OCR برای پایتون از طریق دات نت شبکه های عصبی آموزش دیده ای را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:

غلط‌گیر املای داخلی

اگرچه کتابخانه Python OCR ما دقت تشخیص بالایی را ارائه می‌کند، نقص چاپ، کثیفی یا فونت‌های غیر استاندارد ممکن است باعث شود برخی از کاراکترها یا کلمات به اشتباه تشخیص داده شوند. برای بهبود بیشتر نتایج تشخیص، می‌توانید غلط‌گیر املا را روشن کنید، که خطاهای املایی را براساس زبان تشخیص انتخاب‌شده پیدا کرده و به‌طور خودکار تصحیح می‌کند.

اگر متن شناسایی شده حاوی اصطلاحات تخصصی، اختصارات و کلمات دیگری است که در فرهنگ لغت های املایی رایج وجود ندارد، می توانید فهرست کلمات خود را ارائه دهید.

تشخیص دسته

Python OCR API شما را از تشخیص تک تک تصاویر آزاد می کند. از روش‌های مختلف پردازش دسته‌ای برای تشخیص چندین تصویر در یک تماس استفاده کنید:

  • تشخیص فایل های PDF چند صفحه ای، TIFF و DjVu.
  • شناسایی تمامی فایل های موجود در یک پوشه
  • تشخیص تمام فایل های موجود در یک آرشیو.
  • تشخیص همه فایل ها از یک لیست.

یادگیری با نمونه

OCR برای پایتون آرایه‌ای از نمونه‌ها را ارائه می‌کند که در پایتون نوشته شده‌اند و به شما این امکان را می‌دهند که به سرعت خود را با عملکردها و قابلیت‌های آن آشنا کنید. برای ایجاد راه‌حل‌های مناسب برای رفع نیازهای تجاری پایتون خود، بینش‌هایی به دست آورید.

ویژگی ها و قابلیت ها

Aspose.OCR for Python via .NET وظایف شما را سریع و آسان حل می کند.

Feature icon

عکس OCR

استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.

Feature icon

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو، فهرست‌بندی و قابل ویرایش تبدیل کنید.

Feature icon

تشخیص URL

تشخیص تصویر از URL بدون بارگیری محلی.

Feature icon

تشخیص انبوه

تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.

Feature icon

هر نوع فونت و سبک

متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.

Feature icon

تشخیص دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

Feature icon

غلط گیر املا

با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.

Feature icon

متن را در تصاویر پیدا کنید

متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.

Feature icon

متن های تصویری را با هم مقایسه کنید

متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.

نمونه کدهای پایتون

برای ادغام یکپارچه OCR در برنامه‌های پایتون خود، نمونه‌های کد را بررسی کنید.

نصب و راه اندازی

Aspose.OCR برای Python از طریق دات نت که به عنوان یک چرخ پایتون یا بسته قابل دانلود مستقل توزیع شده است، به راحتی توزیع می شود. ادغام در پروژه پایتون شما، مستقیماً از محیط توسعه یکپارچه پایتون (IDE) یک فرآیند یکپارچه است. به سادگی آن را نصب کنید، و شما آماده هستید تا از طیف کاملی از قابلیت های OCR استفاده کنید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.

پس از نصب، می توانید بلافاصله از طریق دات نت استفاده از Aspose.OCR برای پایتون را شروع کنید. ، البته با محدودیت های خاصی. یک مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز برمی دارد. از این دوره برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد در مرحله بعد تصمیمی آگاهانه در مورد خرید Aspose.OCR برای Python از طریق دات نت بگیرید.

مجوز بارگیری

lic = License()
lic.set_license(self.licPath)

تشخیص متن روی عکس ها

خواندن متن از هر محتوایی در Aspose OCR برای پایتون به آسانی فراخوانی یک روش تشخیص جهانی است.

تبدیل عکس به متن - پایتون

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

مبدل جهانی پایتون

API ما هر تصویری را از اسکنرها، دوربین‌ها یا گوشی‌های هوشمند می‌خواند: اسناد PDF، JPEG، PNG، TIFF، GIF، تصاویر BMP و حتی فایل‌های DjVu. پشتیبانی کامل از اسناد PDF چند صفحه ای، تصاویر TIFF و DjVu تطبیق پذیری را تضمین می کند. شما همچنین می توانید یک تصویر از وب از طریق یک URL ارائه دهید.

نتایج تشخیص در قالب‌های رایج تبادل اسناد و داده‌ها برگردانده می‌شود: متن ساده، PDF، Microsoft Word، Microsoft Excel، JSON، و XML.

PDF را بشناسید و نتایج را در فرمت های خروجی مختلف ذخیره کنید - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

بهینه سازی منابع در پایتون

تشخیص نوری کاراکتر به منابع نیاز دارد. API ما راه‌های انعطاف‌پذیری را برای متعادل کردن سه گانه کلاسیک زمان-قیمت-کیفیت ارائه می‌دهد:

  • بین تشخیص کامل و تشخیص سریع یکی را انتخاب کنید.
  • تعداد رشته های اختصاص داده شده برای شناسایی را مشخص کنید، یا به کتابخانه اجازه دهید تا به طور خودکار به تعداد هسته های پردازنده مقیاس شود.
  • با بارگذاری محاسبات در باطن دات نت، CPU را آزاد کنید.

تشخیص سریع - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

تک خط را بشناسید

اگر تصویر شما از قبل به یک خط متن بریده شده است، می توان آن را در سریع ترین حالت ممکن، بدون اصلاحات خودکار، تشخیص ساختار محتوا و سایر مراحل مصرف کننده منابع، تشخیص داد. می تواند سرعت OCR را تا 7 برابر سریعتر از فرآیند تشخیص عادی افزایش دهد.

تشخیص تک خط متن روی تصویر - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)