چرا Aspose.ocr for Python از طریق .NET؟

سفر با Aspose OCR را برای Python از طریق .NET-یک API OCR همه کاره و کاربر پسند. عملکرد OCR را در برنامه های Python خود با کمتر از 5 خط کد جاسازی کرده و نیاز به شبکه های پیچیده ریاضی یا عصبی را از بین می برد. موتور قدرتمند OCR ما سرعت و دقت بی نظیری را ارائه می دهد و از 140+ زبان از جمله انگلیسی ، سیریلیک ، عربی ، فارسی ، هندی ، چینی ، ژاپنی ، کره ای ، تامیل و موارد دیگر پشتیبانی می کند. چه تصاویر اسکن شده ، عکس های تلفن های هوشمند ، تصاویر ، یا PDF های اسکن شده ، در قالب های محبوب اسناد و تبادل داده ها به دست می آورند. فیلترهای پیش پردازش را برای کنترل تصاویر چرخان ، چرب و پر سر و صدا اهرم کنید.

Illustration ocr

OCR کارآمد و دقیق

سرعت و دقت بی نظیر را در نتایج OCR با فناوری پیشرفته پایتون تجربه کنید.

چند زبانه

متن را به زبان 140+ بشناسید: انگلیسی ، فرانسوی ، آلمانی ، اسپانیایی ، روسی ، چینی ، هندی ، ژاپنی ، کره ای ، تامیل ، عربی ، فارسی و موارد دیگر.

جهانی

با استفاده از پایتون ، تصاویر را از منابع متنوع - اسکنرها ، دوربین ها و تلفن های هوشمند پردازش کنید.

زبانهای آسیایی

به رسمیت شناختن دقیق اسکریپت های چینی ، عربی ، Devanagari و Dravidian و همچنین متون به زبان مختلط دست یابید.

چیدمان حفظ

قالب بندی منبع را برای نمایش دقیق متن حفظ کنید و جداول را تشخیص دهید.

نمونه کد زنده

فقط در سه خط کد پایتون یک تصویر را به متن تبدیل کنید. خودتان را امتحان کنید!

آماده تشخیص آماده تشخیص یک فایل را در اینجا رها کنید یا برای مرور * کلیک کنید

* با بارگذاری پرونده های خود یا استفاده از خدماتی که با ما موافق هستید شرایط استفاده وت سیاست حفظ حریم.

نتیجه تشخیص
 
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

اولویت خود را انتخاب کنید

کتابخانه مناسب را برای نیازهای خود انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.

تطبیق پذیری

Python via .NET

توسعه آسان ، خوانایی و حفظ کد
بیشترین ویژگی ها را دارد و بیشترین به روزرسانی ها را دریافت می کند
سرعت کلی ممکن است کمی کندتر از سایر سیستم عامل ها باشد

یکسان بودن

Python via Java

از همان کتابخانه در هر سیستم عامل استفاده کنید
یکپارچه برنامه خود را در هر دستگاه اجرا کنید
به نسخه 8 یا بعد از آن نیاز به محیط زمان اجرا جاوا (JRE) دارد

عمل

Python via C++

سریعترین سرعت ممکن بدون در نظر گرفتن سیستم عامل
کنترل زیادی بر مدیریت منابع
هدفمند به توسعه دهندگان با تجربه

همه جا اجرا می شود

صرف نظر از نام ، aspose.ocr for Python از طریق .NET نیازی به نصب .NET در سکوی هدف ندارد. بسته نصب در حال حاضر با کلیه مؤلفه های مورد نیاز همراه است و می تواند یکپارچه بر روی هر سیستم عامل کار کند - خواه یک دستگاه محلی ، سرور وب یا ابر باشد.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

قالب های فایل پشتیبانی شده

Aspose.OCR for Python via .NET می تواند با هر [پرونده]کار کند( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد ، به یک پایگاه داده وارد کرد یا در زمان واقعی مورد تجزیه و تحلیل قرار گرفت.

تصاویر

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

دسته OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتایج تشخیص

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

نصب

Aspose.ocr for Python از طریق .NET به عنوان یک بسته پایتون با حداقل وابستگی یا به عنوان یک پرونده قابل بارگیری یا pypi بسته تحویل داده می شود. به راحتی نصب آن را وارد پروژه خود کنید ، و شما آماده هستید تا متون را به زبان 140+ بشناسید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.

درخواست مجوز آزمایشی برای شروع توسعه یک برنامه OCR کاملاً کاربردی و بدون محدودیت.

OCR تحت پایتون

کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا یکپارچه بر روی هر سیستم عامل اجرا شوند - دسک تاپ ویندوز ، ویندوز سرور ، مکوس ، لینوکس و ابر.

140+ زبان تشخیص

کتابخانه Java OCR ما یک راه حل جهانی برای پردازش اسناد ، استخراج داده ها و دیجیتالی شدن محتوا در مقیاس جهانی است. با حمایت از طیف گسترده ای از اسکریپت های نوشتن اروپایی ، خاورمیانه و آسیایی ، برای هر کشور و تجارت سازگار است.

به عنوان OCR برای جاوا متن را در اسناد چند زبانه مانند چینی/انگلیسی ، عربی/فرانسوی یا سیریلیک/انگلیسی به رسمیت می شناسد. زبانهای زیر پشتیبانی می شوند:

  • ** گسترش یافته لاتین **: انگلیسی ، اسپانیایی ، فرانسوی ، اندونزی ، پرتغالی ، آلمانی ، ویتنامی ، ترکی ، ایتالیایی ، لهستانی و 80+ بیشتر.
  • ** سیریلیک ** الفبای: روسی ، اوکراینی ، قزاق ، بلغاری ، از جمله متون مخلوط سیریلیک/انگلیسی.
  • عربی ، فارسی ، اردو ، از جمله متون مخلوط با انگلیسی.
  • زبان های چینی ، کره ای ، ژاپنی ، Devanagari و Dravidian ، از جمله هندی ، تامیل ، مراتی و دیگران. متون به زبان مختلط نیز پشتیبانی می شوند.

فیلترهای پردازش قدرتمند

صحت و قابلیت اطمینان تشخیص شخصیت نوری به کیفیت تصویر اصلی وابسته است. به عنوان OCR برای پایتون از طریق .NET تعداد زیادی از فیلترهای پردازش کاملاً خودکار و دستی را ارائه می دهد که قبل از ارسال به موتور OCR یک تصویر را تقویت می کند:

  • به طور خودکار تصاویر وارونه و چرخان را بچرخانید.
  • تصاویر معکوس را تشخیص داده و متن سفید روی سیاه را استخراج کنید.
  • به طور خودکار خاک ، لکه ها ، خراش ها ، تابش خیره کننده ، شیب ناخواسته و سایر سر و صدای را از بین ببرید.
  • کنتراست تصویر را بطور خودکار تنظیم کنید.
  • به صورت خودکار مجلل ، یا به صورت دستی تصویر را تغییر اندازه دهید.
  • تصاویر را به مقیاس سیاه و سفید یا خاکستری تبدیل کنید.
  • مناطق بالقوه مشکل ساز تصویر را پیدا کرده و اطلاعات را در مورد نوع نقص و مختصات آن برگردانید.
  • ضخامت شخصیت ها را در یک تصویر افزایش دهید.
  • تصاویر پر سر و صدا هنگام حفظ لبه های حروف.
  • انحراف صفحه را صاف کرده و اعوجاج لنز دوربین را برای عکس های صفحه اصلاح کنید.

برای انواع خاص سند بهینه شده است

به عنوان OCR برای پایتون از طریق .NET شبکه های عصبی ویژه آموزش دیده را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:

داخلی طلسم داخلی

اگرچه کتابخانه Python OCR ما صحت شناخت بالایی را ارائه می دهد ، نقص چاپ ، خاک یا قلم های غیر استاندارد ممکن است باعث شود شخصیت ها یا کلمات خاصی نادرست شناخته شوند. برای بهبود بیشتر نتایج تشخیص ، می توانید طلسم را روشن کنید ، که خطاهای املایی را بر اساس زبان تشخیص انتخاب شده پیدا کرده و به طور خودکار اصلاح می کند.

اگر متن شناخته شده حاوی اصطلاحات تخصصی ، اختصارات و کلمات دیگر باشد که در فرهنگ لغت های املایی مشترک وجود ندارد ، می توانید لیست های کلمه خود را ارائه دهید.

شناخت دسته

Python OCR API ما شما را از شناخت تصاویر یک به یک آزاد می کند. از روشهای مختلف پردازش دسته ای استفاده کنید تا چندین تصویر را در یک تماس تشخیص دهید:

  • به رسمیت شناختن پرونده های PDF ، TIFF و DJVU چند صفحه ای.
  • شناخت همه پرونده ها در یک پوشه.
  • شناخت همه پرونده ها در یک بایگانی.
  • شناخت همه پرونده ها از یک لیست.

یادگیری توسط نمونه

OCR برای Python مجموعه ای از نمونه ها را که در پایتون نوشته شده است ، فراهم می کند و به شما امکان می دهد تا خود را با عملکرد و توانایی های خود به سرعت آشنا کنید. برای ایجاد راه حل های متناسب برای پاسخگویی به نیازهای تجاری پایتون ، بینش کسب کنید.

ویژگی ها و قابلیت ها

Aspose.OCR for Python via .NET Aspose.ocr for Python از طریق .NET وظایف شما را سریع و آسان حل می کند.

Feature icon

عکس OCR

متن را از عکس های تلفن هوشمند با دقت در سطح اسکن استخراج کنید.

Feature icon

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو ، شاخص و قابل ویرایش تبدیل کنید.

Feature icon

شناخت URL

بدون بارگیری در محلی ، تصویری را از URL تشخیص دهید.

Feature icon

شناخت انبوه

تمام تصاویر را از اسناد ، پوشه ها و بایگانی های چند صفحه ای بخوانید.

Feature icon

هر قلم و سبک

متن را در همه نوع و سبک های محبوب شناسایی و تشخیص دهید.

Feature icon

شناخت تنظیم دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

Feature icon

طلسم طلسم

با اصلاح خودکار کلمات غلط املایی ، نتایج را بهبود بخشید.

Feature icon

متن را در تصاویر پیدا کنید

متن یا بیان منظم را در مجموعه ای از تصاویر جستجو کنید.

Feature icon

متون تصویر را مقایسه کنید

متون را بدون در نظر گرفتن مورد و چیدمان بر روی دو تصویر مقایسه کنید.

نمونه کد پایتون

برای ادغام یکپارچه OCR در برنامه های پایتون خود ، نمونه های کد را وارد کنید.

نصب

توزیع شده به عنوان یک چرخ پایتون یا بسته قابل بارگیری خود ، Aspose.ocr for Python از طریق .NET به راحتی توزیع می شود. ادغام در پروژه Python شما ، مستقیماً از محیط توسعه یکپارچه Python Python (IDE) ، یک فرایند یکپارچه است. به سادگی آن را نصب کنید ، و شما آماده هستید تا از طیف کاملی از قابلیت های OCR استفاده کنید ، و نتایج تشخیص را در قالب های مختلف صرفه جویی می کنید. مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز بلند می کند. از این دوره برای شروع توسعه یک برنامه OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد تصمیم آگاهانه ای در مورد خرید Aspose.ocr برای Python از طریق .NET در مرحله بعدی بگیرید.

مجوز بار

lic = License()
lic.set_license(self.licPath)

متن را در عکس ها تشخیص دهید

خواندن متن از هر محتوا در Aspose OCR برای Python به آسانی است که یک روش تشخیص جهانی را فراخوانی می کند.

تبدیل عکس به متن - پایتون

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

مبدل جهانی پایتون

API ما به طور دقیق هر تصویری را از اسکنرها ، دوربین ها یا تلفن های هوشمند می خواند: اسناد PDF ، JPEG ، PNG ، TIFF ، GIF ، تصاویر BMP و حتی پرونده های DJVU. پشتیبانی کامل از اسناد PDF چند صفحه ای ، تصاویر TIFF و DJVU تطبیق پذیری را تضمین می کند. همچنین می توانید از طریق URL تصویری از وب ارائه دهید.

نتایج تشخیص در قالب های محبوب اسناد و تبادل داده بازگردانده می شود: متن ساده ، PDF ، Microsoft Word ، Microsoft Excel ، JSON و XML.

PDF را بشناسید و نتایج را در قالب های مختلف خروجی ذخیره کنید - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

بهینه سازی منابع در پایتون

تشخیص شخصیت نوری منابع را می طلبد. API ما روشهای انعطاف پذیر برای تعادل سه گانه با کیفیت قیمت کلاسیک ارائه می دهد:

  • بین شناخت کامل و شناخت سریع را انتخاب کنید.
  • تعداد موضوعات اختصاص یافته برای تشخیص را مشخص کنید ، یا به کتابخانه اجازه دهید به طور خودکار به تعداد هسته های پردازنده مقیاس بندی کند.
  • CPU را با بارگذاری محاسبات به باطن .NET آزاد کنید.

شناخت سریع - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

تک خط را تشخیص دهید

اگر تصویر شما از قبل به یک خط متن تبدیل شده است ، می توان در سریعترین حالت ممکن ، بدون اصلاحات خودکار ، تشخیص ساختار محتوا و سایر مراحل مصرف کننده منابع شناخته شد. این می تواند OCR را تا 7 برابر سریعتر از فرآیند تشخیص عادی سرعت بخشد.

یک خط متن را روی تصویر تشخیص دهید - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)