چرا Aspose.OCR برای پایتون از طریق جاوا؟

Aspose.OCR برای پایتون از طریق جاوا به طور یکپارچه قابلیت‌های قدرتمند تشخیص کاراکتر نوری (OCR) را در نوت‌بوک‌ها و برنامه‌های کاربردی پایتون چند پلتفرمی ادغام می‌کند. با API بصری و پرسرعت ما، می‌توانید متن را از اسکن‌ها، اسکرین‌شات‌ها، لینک‌های وب، یا عکس‌های گوشی‌های هوشمند بدون زحمت استخراج کنید و نتایجی را ارائه دهید که برای ادغام، تجزیه و تحلیل یا ذخیره‌سازی آماده هستند. تصاویر اسکن شده، عکس های گوشی هوشمند، اسکرین شات ها و پی دی اف های اسکن شده را بشناسید و نتایج را در قالب های سند محبوب ذخیره کنید. فیلترهای پیش پردازش پیشرفته تصاویر چرخان، کج و نویز را کنترل می کنند. عملکرد را با بارگیری وظایف در GPU بهینه کنید.

Illustration ocr

OCR سریع و دقیق

با پایتون پیشرفته ما از طریق فناوری جاوا به نتایج OCR با سرعت بالا و دقیق برسید.

پشتیبانی چند زبانه

متن را به بیش از 130 زبان، از جمله لاتین، سیریلیک، عربی، فارسی، هندی، و اسکریپت چینی تشخیص دهید و از تطبیق پذیری برنامه های پایتون خود از طریق جاوا اطمینان حاصل کنید.

پشتیبانی از تصویر انعطاف پذیر

تصاویر اسکنرها، دوربین‌ها و گوشی‌های هوشمند را به‌طور یکپارچه با پایتون از طریق جاوا پردازش کنید.

دقت در تشخیص کاراکتر چینی

بیش از 6000 کاراکتر چینی را با دقت در پروژه های پایتون خود از طریق جاوا تشخیص دهید.

حفظ سبک فونت و قالب بندی

سبک‌های فونت و قالب‌بندی را برای نمایش دقیق متن شناخته شده در برنامه‌های پایتون خود از طریق جاوا حفظ کنید.

نمونه کد زنده

تشخیص متن را از تصاویر تنها در سه خط کد آغاز کنید. سادگی را تجربه کنید!

آماده تشخیص آماده تشخیص یک فایل را اینجا رها کنید یا برای مرور کلیک کنید *

* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.

نتیجه شناخت
 

تبدیل تصویر به متن

نمونه های بیشتر >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

ترجیح خود را انتخاب کنید

کتابخانه مناسب برای نیازهای خود را انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.

تطبیق پذیری

Python via .NET

توسعه آسان، خوانایی و قابلیت نگهداری کد
دارای بیشترین ویژگی ها و دریافت اغلب به روز رسانی
سرعت کلی ممکن است کمی کندتر از سایر سیستم عامل ها باشد

یکنواختی

Python via Java

از همان کتابخانه در هر پلتفرمی استفاده کنید
برنامه خود را به طور یکپارچه بر روی هر دستگاهی اجرا کنید
به Java Runtime Environment (JRE) نسخه 8 یا بالاتر نیاز دارد

عملکرد

Python via C++

سریع ترین سرعت ممکن صرف نظر از پلت فرم
کنترل زیادی بر مدیریت منابع
برای توسعه دهندگان با تجربه هدف گذاری شده است

سازگاری با Backend جاوا

کتابخانه ما که به‌عنوان یک ماژول پایتون طراحی شده است، سازگاری با سیستم‌عامل‌های اصلی را که جاوا را پشتیبانی می‌کنند - از جمله Microsoft Windows، Linux، و macOS، یا پلتفرم های ابری این به شما امکان می دهد برنامه ها را بر روی یک پلتفرم توسعه دهید و آنها را به طور یکپارچه روی پلتفرم دیگری اجرا کنید و نیازی به هرگونه تغییر کد را از بین ببرد.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

فرمت های فایل پشتیبانی شده

Aspose.OCR for Python via Java می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.

تصاویر

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR دسته ای

  • Multi-page PDF
  • ZIP
  • Folder

نتایج شناسایی

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

نصب بدون دردسر پایتون از طریق جاوا

Aspose.OCR برای پایتون از طریق جاوا به عنوان یک بسته پایتون یا به عنوان یک فایل قابل دانلود با حداقل وابستگی تحویل داده می شود. به راحتی آن را در پروژه خود نصب کنید و آماده تشخیص متون در چندین زبان پشتیبانی شده و ذخیره نتایج تشخیص در قالب‌های مختلف هستید.

درخواست مجوز آزمایشی برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی بدون محدودیت.

OCR قدرتمند برای برنامه های کاربردی پایتون

کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا به طور یکپارچه بر روی هر پلتفرمی اجرا شوند - ویندوز دسکتاپ، ویندوز سرور، macOS، لینوکس و ابر.

130+ زبان تشخیص

Python و Java OCR API ما تعداد زیادی از زبان‌ها و اسکریپت‌های نوشتاری محبوب، از جمله زبان‌های ترکیبی را می‌شناسد:

تشخیص زبان را به کتابخانه بسپارید یا خودتان زبان را برای بهبود عملکرد تشخیص و قابلیت اطمینان تعریف کنید.

  • ** الفبای لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
  • ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، صربی، بلاروسی، بلغاری؛
  • عربی، فارسی، اردو؛
  • خط چینی و دوانگاری، از جمله هندی، مراتی، بوجپوری، و دیگران.

فیلترهای پردازش تصویر پیشرفته

دقت تشخیص کاراکتر نوری به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose.OCR برای پایتون از طریق جاوا مجموعه وسیعی از فیلترهای پردازش خودکار و دستی تصویر را برای بهینه سازی تصویر قبل از ارسال به موتور OCR ارائه می دهد:

  • به طور خودکار تصاویر کمی کج شده را صاف کنید.
  • چرخش تصاویر با انحراف شدید را به صورت دستی اصلاح کنید.
  • به طور خودکار کثیفی، لکه ها، خراش ها، تابش خیره کننده، شیب های ناخواسته، و انواع دیگر صداها را حذف کنید.
  • کنتراست تصویر را به صورت خودکار تنظیم کنید.
  • اندازه تصویر را به صورت خودکار یا دستی تغییر دهید.
  • تصاویر را به سیاه و سفید یا خاکستری تبدیل کنید.
  • رنگ های تصویر را معکوس کنید، مناطق روشن را تاریک و مناطق تاریک را روشن نشان دهید.
  • ضخامت کاراکترها را در یک تصویر افزایش دهید.
  • با حفظ لبه های حروف، تصاویر پر سر و صدا را تار کنید.
  • انحراف صفحه را صاف کنید و اعوجاج لنز دوربین را در عکس های صفحه اصلاح کنید.

API های اختصاصی برای انواع سند

Aspose.OCR برای پایتون از طریق جاوا شبکه های عصبی آموزش دیده ای را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:

  • کارت های شناسایی و پاسپورت های اسکن شده یا عکس گرفته شده.
  • پلاک خودرو.
  • فاکتورها
  • رسیدها

غلط‌گیر املای داخلی

اگرچه Aspose.OCR برای پایتون از طریق جاوا دقت تشخیص بالایی را ارائه می‌کند، نقص چاپ، کثیفی یا فونت‌های غیر استاندارد ممکن است باعث شود برخی از کاراکترها یا کلمات به اشتباه تشخیص داده شوند. برای بهبود بیشتر نتایج تشخیص، می‌توانید غلط‌گیر املا را روشن کنید، که خطاهای املایی را براساس زبان تشخیص انتخاب‌شده پیدا کرده و به‌طور خودکار تصحیح می‌کند.

اگر متن شناسایی شده حاوی اصطلاحات تخصصی، اختصارات و کلمات دیگری است که در فرهنگ لغت های املایی رایج وجود ندارد، می توانید فهرست کلمات خود را ارائه دهید.

تشخیص دسته ای کارآمد

Python OCR API ما به شما امکان می دهد تا تشخیص تصویر را ساده کنید. از روش های پردازش دسته ای همه کاره برای پردازش کارآمد چندین تصویر در یک تماس استفاده کنید:

  • تشخیص فایل های PDF چند صفحه ای، TIFF.
  • تمام فایل های داخل یک پوشه را پردازش کنید.
  • تشخیص دسته برای همه فایل های یک آرشیو.
  • تشخیص تصاویر از یک لیست مشخص.

یادگیری از طریق مثال های پایتون

انواع نمونه‌های Python را که برای کمک به شما در درک سریع عملکردها و قابلیت‌های راه‌حل OCR ما طراحی شده‌اند، کاوش کنید. به سرعت در مورد ایجاد راه حل های سفارشی که نیازهای خاص کسب و کار شما را برآورده می کند بینش به دست آورید.

ویژگی ها و قابلیت ها

Aspose.OCR for Python via Java ویژگی های پیشرفته Aspose.OCR برای پایتون را کاوش کنید

Feature icon

عکس OCR

استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.

Feature icon

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو و فهرست‌بندی تبدیل کنید.

Feature icon

تشخیص URL

تشخیص تصویر از URL بدون بارگیری محلی.

Feature icon

تشخیص انبوه

تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.

Feature icon

هر نوع فونت و سبک

متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.

Feature icon

تشخیص دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

Feature icon

غلط گیر املا

با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.

Feature icon

متن را در تصاویر پیدا کنید

متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.

Feature icon

متن های تصویری را با هم مقایسه کنید

متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.

نمونه کدهای پایتون

برای ادغام یکپارچه Aspose.OCR برای Python از طریق جاوا در برنامه های خود، نمونه های کد را کشف کنید.

نصب بدون زحمت

به عنوان یک بسته پایتون یا یک فایل قابل دانلود با حداقل وابستگی، Aspose.OCR برای پایتون از طریق جاوا توزیع آسان را تضمین می کند. آن را مستقیماً از پایتون در پروژه خود ادغام کنید، و آماده می شوید که از قابلیت های OCR کامل استفاده کنید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.

پس از نصب، فوراً استفاده از Aspose.OCR برای پایتون را از طریق جاوا شروع کنید. هر چند با محدودیت های خاص یک مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از این دوره برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد بعداً تصمیمی آگاهانه در مورد خرید Aspose.OCR برای پایتون از طریق جاوا بگیرید.

مجوز بارگیری

lic = License()
lic.set_license(self.licPath)

تشخیص تصویر

چالش اصلی در برنامه های OCR، کمبود اسکنر برای کاربران نهایی است. API ما که به طور یکپارچه با پایتون از طریق جاوا ادغام شده است، دارای فیلترهای پیش پردازش تصویر داخلی قوی است که تصاویر چرخان، کج و نویز را مدیریت می کند. همراه با پشتیبانی از همه فرمت های تصویر، امکان تشخیص قابل اعتماد، حتی از عکس های گوشی هوشمند را فراهم می کند. اکثر پیش پردازش ها و تصحیح تصویر خودکار هستند و فقط در موارد چالش برانگیز به مداخله شما نیاز دارند.

اعمال تصحیح خودکار تصویر - پایتون

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

مبدل جهانی پایتون

API ما هر تصویری را از اسکنرها، دوربین‌ها یا گوشی‌های هوشمند می‌خواند: اسناد PDF، JPEG، PNG، TIFF، GIF، فایل‌های BMP. پشتیبانی کامل از اسناد PDF چند صفحه ای، تصاویر TIFF و DjVu تطبیق پذیری را تضمین می کند. شما همچنین می توانید یک تصویر از وب از طریق یک URL ارائه دهید.

نتایج تشخیص در قالب‌های رایج تبادل اسناد و داده‌ها برگردانده می‌شود: متن ساده، PDF، Microsoft Word، Microsoft Excel، JSON، و XML.

PDF را بشناسید و نتایج را در فرمت های خروجی مختلف ذخیره کنید - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

بهینه سازی استفاده از منابع

OCR یک الگوریتم تشخیص ویژه برای استخراج محتوا از تصاویر با متن کم و پس زمینه های پر سر و صدا/رنگی ارائه می دهد. این روش به طور قابل توجهی دقت OCR را در موارد تجاری زیر بهبود می بخشد:

  • متن از عکس های خیابان را بخوانید.
  • بخش بندی و شناسایی علائم جاده و تابلوهای راهنما در تصاویر خیابان.
  • برچسب های قیمت را پیدا کنید و متن استخراج شده را به عنوان قیمت تفسیر کنید.
  • مناطق مورد علاقه را در برچسب های مواد غذایی، مانند اطلاعات تغذیه ای یا لیست مواد تشکیل دهنده، پیدا کرده و جمع آوری کنید.
  • شناسایی و تجزیه و تحلیل پلاک خودرو.
  • متن را از منوها و کاتالوگ ها استخراج کنید.

OCR ناحیه باز - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

استخراج متن از عکس های خیابانی

OCR برای پایتون یک الگوریتم تشخیص ویژه ارائه می دهد که متن را از پلاک خودروها، از جمله عکس های تیره و تار استخراج می کند. سپس متن به دست آمده می تواند به طور خودکار در پایگاه داده ذخیره شود یا به طور خودکار تأیید شود.

تشخیص شماره ماشین - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)