OCR for Java

OCR for C++

OCR for Python via .NET

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via Java

تبدیل تصویر به متن با Python OCR API از طریق جاوا

قدرت OCR در پایتون را با استفاده از Aspose.OCR غنی از ویژگی های ما برای پایتون از طریق کتابخانه جاوا باز کنید. تبدیل تصاویر و PDF به متن قابل ویرایش بدون زحمت.

دانلود کنید محاکمه خرید

ببینید چه چیز جدیدی است

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-java or
download

چرا Aspose.OCR برای پایتون از طریق جاوا؟

Aspose.OCR برای پایتون از طریق جاوا به طور یکپارچه قابلیت‌های قدرتمند تشخیص کاراکتر نوری (OCR) را در نوت‌بوک‌ها و برنامه‌های کاربردی پایتون چند پلتفرمی ادغام می‌کند. با API بصری و پرسرعت ما، می‌توانید متن را از اسکن‌ها، اسکرین‌شات‌ها، لینک‌های وب، یا عکس‌های گوشی‌های هوشمند بدون زحمت استخراج کنید و نتایجی را ارائه دهید که برای ادغام، تجزیه و تحلیل یا ذخیره‌سازی آماده هستند. تصاویر اسکن شده، عکس های گوشی هوشمند، اسکرین شات ها و پی دی اف های اسکن شده را بشناسید و نتایج را در قالب های سند محبوب ذخیره کنید. فیلترهای پیش پردازش پیشرفته تصاویر چرخان، کج و نویز را کنترل می کنند. عملکرد را با بارگیری وظایف در GPU بهینه کنید.

OCR سریع و دقیق

با پایتون پیشرفته ما از طریق فناوری جاوا به نتایج OCR با سرعت بالا و دقیق برسید.

پشتیبانی چند زبانه

متن را به بیش از 130 زبان، از جمله لاتین، سیریلیک، عربی، فارسی، هندی، و اسکریپت چینی تشخیص دهید و از تطبیق پذیری برنامه های پایتون خود از طریق جاوا اطمینان حاصل کنید.

پشتیبانی از تصویر انعطاف پذیر

تصاویر اسکنرها، دوربین‌ها و گوشی‌های هوشمند را به‌طور یکپارچه با پایتون از طریق جاوا پردازش کنید.

دقت در تشخیص کاراکتر چینی

بیش از 6000 کاراکتر چینی را با دقت در پروژه های پایتون خود از طریق جاوا تشخیص دهید.

حفظ سبک فونت و قالب بندی

سبک‌های فونت و قالب‌بندی را برای نمایش دقیق متن شناخته شده در برنامه‌های پایتون خود از طریق جاوا حفظ کنید.

نمونه کد زنده

تشخیص متن را از تصاویر تنها در سه خط کد آغاز کنید. سادگی را تجربه کنید!

آماده تشخیص آماده تشخیص یک فایل را اینجا رها کنید یا برای مرور کلیک کنید *

* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.

نتیجه شناخت

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

ترجیح خود را انتخاب کنید

کتابخانه مناسب برای نیازهای خود را انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.

Python via .NET

توسعه آسان، خوانایی و قابلیت نگهداری کد

دارای بیشترین ویژگی ها و دریافت اغلب به روز رسانی

سرعت کلی ممکن است کمی کندتر از سایر سیستم عامل ها باشد

Python via Java

از همان کتابخانه در هر پلتفرمی استفاده کنید

برنامه خود را به طور یکپارچه بر روی هر دستگاهی اجرا کنید

به Java Runtime Environment (JRE) نسخه 8 یا بالاتر نیاز دارد

Python via C++

سریع ترین سرعت ممکن صرف نظر از پلت فرم

کنترل زیادی بر مدیریت منابع

برای توسعه دهندگان با تجربه هدف گذاری شده است

سازگاری با Backend جاوا

کتابخانه ما که به‌عنوان یک ماژول پایتون طراحی شده است، سازگاری با سیستم‌عامل‌های اصلی را که جاوا را پشتیبانی می‌کنند - از جمله Microsoft Windows، Linux، و macOS، یا پلتفرم های ابری این به شما امکان می دهد برنامه ها را بر روی یک پلتفرم توسعه دهید و آنها را به طور یکپارچه روی پلتفرم دیگری اجرا کنید و نیازی به هرگونه تغییر کد را از بین ببرد.

فرمت های فایل پشتیبانی شده

Aspose.OCR for Python via Java می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.

تصاویر

PDF
JPEG
PNG
TIFF
GIF
Bitmap

OCR دسته ای

Multi-page PDF
ZIP
Folder

نتایج شناسایی

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

نصب بدون دردسر پایتون از طریق جاوا

Aspose.OCR برای پایتون از طریق جاوا به عنوان یک بسته پایتون یا به عنوان یک فایل قابل دانلود با حداقل وابستگی تحویل داده می شود. به راحتی آن را در پروژه خود نصب کنید و آماده تشخیص متون در چندین زبان پشتیبانی شده و ذخیره نتایج تشخیص در قالب‌های مختلف هستید.

درخواست مجوز آزمایشی برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی بدون محدودیت.

OCR قدرتمند برای برنامه های کاربردی پایتون

کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا به طور یکپارچه بر روی هر پلتفرمی اجرا شوند - ویندوز دسکتاپ، ویندوز سرور، macOS، لینوکس و ابر.

130+ زبان تشخیص

Python و Java OCR API ما تعداد زیادی از زبان‌ها و اسکریپت‌های نوشتاری محبوب، از جمله زبان‌های ترکیبی را می‌شناسد:

تشخیص زبان را به کتابخانه بسپارید یا خودتان زبان را برای بهبود عملکرد تشخیص و قابلیت اطمینان تعریف کنید.

** الفبای لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، صربی، بلاروسی، بلغاری؛
عربی، فارسی، اردو؛
خط چینی و دوانگاری، از جمله هندی، مراتی، بوجپوری، و دیگران.

فیلترهای پردازش تصویر پیشرفته

دقت تشخیص کاراکتر نوری به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose.OCR برای پایتون از طریق جاوا مجموعه وسیعی از فیلترهای پردازش خودکار و دستی تصویر را برای بهینه سازی تصویر قبل از ارسال به موتور OCR ارائه می دهد:

به طور خودکار تصاویر کمی کج شده را صاف کنید.
چرخش تصاویر با انحراف شدید را به صورت دستی اصلاح کنید.
به طور خودکار کثیفی، لکه ها، خراش ها، تابش خیره کننده، شیب های ناخواسته، و انواع دیگر صداها را حذف کنید.
کنتراست تصویر را به صورت خودکار تنظیم کنید.
اندازه تصویر را به صورت خودکار یا دستی تغییر دهید.
تصاویر را به سیاه و سفید یا خاکستری تبدیل کنید.
رنگ های تصویر را معکوس کنید، مناطق روشن را تاریک و مناطق تاریک را روشن نشان دهید.
ضخامت کاراکترها را در یک تصویر افزایش دهید.
با حفظ لبه های حروف، تصاویر پر سر و صدا را تار کنید.
انحراف صفحه را صاف کنید و اعوجاج لنز دوربین را در عکس های صفحه اصلاح کنید.

API های اختصاصی برای انواع سند

Aspose.OCR برای پایتون از طریق جاوا شبکه های عصبی آموزش دیده ای را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:

کارت های شناسایی و پاسپورت های اسکن شده یا عکس گرفته شده.
پلاک خودرو.
فاکتورها
رسیدها

غلط‌گیر املای داخلی

اگرچه Aspose.OCR برای پایتون از طریق جاوا دقت تشخیص بالایی را ارائه می‌کند، نقص چاپ، کثیفی یا فونت‌های غیر استاندارد ممکن است باعث شود برخی از کاراکترها یا کلمات به اشتباه تشخیص داده شوند. برای بهبود بیشتر نتایج تشخیص، می‌توانید غلط‌گیر املا را روشن کنید، که خطاهای املایی را براساس زبان تشخیص انتخاب‌شده پیدا کرده و به‌طور خودکار تصحیح می‌کند.

اگر متن شناسایی شده حاوی اصطلاحات تخصصی، اختصارات و کلمات دیگری است که در فرهنگ لغت های املایی رایج وجود ندارد، می توانید فهرست کلمات خود را ارائه دهید.

تشخیص دسته ای کارآمد

Python OCR API ما به شما امکان می دهد تا تشخیص تصویر را ساده کنید. از روش های پردازش دسته ای همه کاره برای پردازش کارآمد چندین تصویر در یک تماس استفاده کنید:

تشخیص فایل های PDF چند صفحه ای، TIFF.
تمام فایل های داخل یک پوشه را پردازش کنید.
تشخیص دسته برای همه فایل های یک آرشیو.
تشخیص تصاویر از یک لیست مشخص.

یادگیری از طریق مثال های پایتون

انواع نمونه‌های Python را که برای کمک به شما در درک سریع عملکردها و قابلیت‌های راه‌حل OCR ما طراحی شده‌اند، کاوش کنید. به سرعت در مورد ایجاد راه حل های سفارشی که نیازهای خاص کسب و کار شما را برآورده می کند بینش به دست آورید.

ویژگی ها و قابلیت ها

Aspose.OCR for Python via Java ویژگی های پیشرفته Aspose.OCR برای پایتون را کاوش کنید

عکس OCR

استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو و فهرست‌بندی تبدیل کنید.

تشخیص URL

تشخیص تصویر از URL بدون بارگیری محلی.

تشخیص انبوه

تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.

هر نوع فونت و سبک

متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.

تشخیص دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

غلط گیر املا

با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.

متن را در تصاویر پیدا کنید

متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.

متن های تصویری را با هم مقایسه کنید

متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.

نمونه کدهای پایتون

برای ادغام یکپارچه Aspose.OCR برای Python از طریق جاوا در برنامه های خود، نمونه های کد را کشف کنید.

نصب بدون زحمت

به عنوان یک بسته پایتون یا یک فایل قابل دانلود با حداقل وابستگی، Aspose.OCR برای پایتون از طریق جاوا توزیع آسان را تضمین می کند. آن را مستقیماً از پایتون در پروژه خود ادغام کنید، و آماده می شوید که از قابلیت های OCR کامل استفاده کنید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.

پس از نصب، فوراً استفاده از Aspose.OCR برای پایتون را از طریق جاوا شروع کنید. هر چند با محدودیت های خاص یک مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از این دوره برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد بعداً تصمیمی آگاهانه در مورد خرید Aspose.OCR برای پایتون از طریق جاوا بگیرید.

مجوز بارگیری

lic = License()
lic.set_license(self.licPath)

تشخیص تصویر

چالش اصلی در برنامه های OCR، کمبود اسکنر برای کاربران نهایی است. API ما که به طور یکپارچه با پایتون از طریق جاوا ادغام شده است، دارای فیلترهای پیش پردازش تصویر داخلی قوی است که تصاویر چرخان، کج و نویز را مدیریت می کند. همراه با پشتیبانی از همه فرمت های تصویر، امکان تشخیص قابل اعتماد، حتی از عکس های گوشی هوشمند را فراهم می کند. اکثر پیش پردازش ها و تصحیح تصویر خودکار هستند و فقط در موارد چالش برانگیز به مداخله شما نیاز دارند.

اعمال تصحیح خودکار تصویر - پایتون

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

مبدل جهانی پایتون

API ما هر تصویری را از اسکنرها، دوربین‌ها یا گوشی‌های هوشمند می‌خواند: اسناد PDF، JPEG، PNG، TIFF، GIF، فایل‌های BMP. پشتیبانی کامل از اسناد PDF چند صفحه ای، تصاویر TIFF و DjVu تطبیق پذیری را تضمین می کند. شما همچنین می توانید یک تصویر از وب از طریق یک URL ارائه دهید.

نتایج تشخیص در قالب‌های رایج تبادل اسناد و داده‌ها برگردانده می‌شود: متن ساده، PDF، Microsoft Word، Microsoft Excel، JSON، و XML.

PDF را بشناسید و نتایج را در فرمت های خروجی مختلف ذخیره کنید - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

بهینه سازی استفاده از منابع

OCR یک الگوریتم تشخیص ویژه برای استخراج محتوا از تصاویر با متن کم و پس زمینه های پر سر و صدا/رنگی ارائه می دهد. این روش به طور قابل توجهی دقت OCR را در موارد تجاری زیر بهبود می بخشد:

متن از عکس های خیابان را بخوانید.
بخش بندی و شناسایی علائم جاده و تابلوهای راهنما در تصاویر خیابان.
برچسب های قیمت را پیدا کنید و متن استخراج شده را به عنوان قیمت تفسیر کنید.
مناطق مورد علاقه را در برچسب های مواد غذایی، مانند اطلاعات تغذیه ای یا لیست مواد تشکیل دهنده، پیدا کرده و جمع آوری کنید.
شناسایی و تجزیه و تحلیل پلاک خودرو.
متن را از منوها و کاتالوگ ها استخراج کنید.

OCR ناحیه باز - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

استخراج متن از عکس های خیابانی

OCR برای پایتون یک الگوریتم تشخیص ویژه ارائه می دهد که متن را از پلاک خودروها، از جمله عکس های تیره و تار استخراج می کند. سپس متن به دست آمده می تواند به طور خودکار در پایگاه داده ذخیره شود یا به طور خودکار تأیید شود.

تشخیص شماره ماشین - پایتون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)