تبدیل تصویر به متن با Python OCR API از طریق جاوا
متن را در تصاویر با پایتون تشخیص دهید
ویترین بیشتر ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
چرا Aspose.ocr for Python از طریق جاوا؟
Aspose.ocr for Python از طریق جاوا یکپارچه قابلیت تشخیص شخصیت نوری قدرتمند (OCR) را در نوت بوک ها و برنامه های پایتون متقاطع خود ادغام می کند. با استفاده از API بصری و پر سرعت ما ، می توانید با زحمت متن را از اسکن ، تصاویر ، پیوندهای وب یا عکس های تلفن های هوشمند استخراج کنید و نتایج را برای ادغام ، تجزیه و تحلیل یا ذخیره سازی ارائه دهید. تصاویر اسکن شده ، عکس های تلفن های هوشمند ، تصاویر و PDF های اسکن شده را تشخیص دهید و نتایج را در قالب های محبوب اسناد ذخیره کنید. فیلترهای پیش پردازش پیشرفته تصاویر چرخشی ، کمرنگ و پر سر و صدا را کنترل می کنند. عملکرد را با بارگیری وظایف به GPU بهینه کنید.

سریع و دقیق OCR
دستیابی به نتایج OCR با سرعت بالا و دقیق با پایتون پیشرفته ما از طریق فناوری جاوا.
پشتیبانی چند زبانه
متن را به زبان 140+ زبان ، از جمله اسکریپت های لاتین ، سیریلیک ، عربی ، فارسی ، شاخص و چینی تشخیص دهید و از تطبیق پذیری برای برنامه های پایتون خود از طریق جاوا اطمینان حاصل کنید.
پشتیبانی از تصویر انعطاف پذیر
تصاویر را از اسکنرها ، دوربین ها و تلفن های هوشمند یکپارچه با پایتون از طریق جاوا پردازش کنید.
دقت در تشخیص شخصیت چینی
بیش از 6000 شخصیت چینی را با دقت در پروژه های پایتون خود از طریق جاوا تشخیص دهید.
سبک های قلم و قالب بندی را حفظ کنید
سبک های قلم و قالب بندی را برای نمایش دقیق متن شناخته شده در برنامه های پایتون خود از طریق جاوا حفظ کنید.
نمونه کد زنده
تشخیص متن را از تصاویر فقط در سه خط کد شروع کنید. سادگی را تجربه کنید!
* با بارگذاری پرونده های خود یا استفاده از خدماتی که با ما موافق هستید شرایط استفاده وت سیاست حفظ حریم.
تبدیل تصویر به متن
نمونه های بیشتر ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
اولویت خود را انتخاب کنید
کتابخانه مناسب را برای نیازهای خود انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.
تطبیق پذیری
Python via .NET
یکسان بودن
Python via Java
عمل
Python via C++
سازگاری پس زمینه جاوا
به عنوان یک ماژول پایتون طراحی شده است ، کتابخانه ما سازگاری را در بین سیستم های عامل اصلی پشتیبانی java - از جمله ویندوز مایکروسافت ، لینوکس و مکوس یا سیستم عامل های ابری تضمین می کند. این امر شما را قادر می سازد تا برنامه های خود را در یک سیستم عامل توسعه داده و آنها را یکپارچه اجرا کنید و نیاز به هرگونه اصلاح کد را از بین ببرید.
قالب های فایل پشتیبانی شده
Aspose.OCR for Python via Java می تواند با هر [پرونده]کار کند( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد ، به یک پایگاه داده وارد کرد یا در زمان واقعی مورد تجزیه و تحلیل قرار گرفت.
تصاویر
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
دسته OCR
- Multi-page PDF
- ZIP
- Folder
نتایج تشخیص
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
نصب بی دردسر برای پایتون از طریق جاوا
Aspose.ocr for Python از طریق جاوا به عنوان یک بسته پایتون یا به عنوان پرونده قابل بارگیری با حداقل وابستگی تحویل داده می شود. به راحتی نصب آن را به پروژه خود می رساند ، و شما آماده هستید تا متون را به زبان های چند پشتیبانی شده بشناسید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.
درخواست مجوز آزمایشی برای شروع توسعه یک برنامه OCR کاملاً کاربردی و بدون محدودیت.
OCR قدرتمند برای برنامه های پایتون
کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا یکپارچه بر روی هر سیستم عامل اجرا شوند - دسک تاپ ویندوز ، ویندوز سرور ، مکوس ، لینوکس و ابر.
140+ زبان تشخیص
Python و Java OCR API ما مجموعه ای از زبان ها و اسکریپت های نوشتن محبوب ، از جمله زبان های مختلط را به رسمیت می شناسد:
تشخیص زبان را به کتابخانه واگذار کنید یا خود را برای افزایش عملکرد و قابلیت اطمینان به خود اختصاص دهید.
- ** گسترش یافته لاتین ** الفبای: انگلیسی ، اسپانیایی ، فرانسوی ، اندونزیایی ، پرتغالی ، آلمانی ، ویتنامی ، ترکی ، ایتالیایی ، لهستانی و 80+ بیشتر ؛
- ** سیریلیک ** الفبای: روسی ، اوکراینی ، قزاق ، صربستان ، بلاروس ، بلغاری ؛
- عربی ، فارسی ، اردو ؛
- اسکریپت چینی و Devanagari ، از جمله هندی ، مراتی ، بوجپوری و دیگران.
فیلترهای پردازش تصویر پیشرفته
دقت تشخیص شخصیت نوری به شدت به کیفیت تصویر اصلی متکی است. Aspose.ocr for Python از طریق جاوا طیف گسترده ای از فیلترهای پردازش تصویر خودکار و دستی را برای بهینه سازی یک تصویر قبل از ارسال به موتور OCR ارائه می دهد:
- به طور خودکار تصاویر کمی کج را صاف کنید.
- به صورت دستی چرخش تصاویر شدید را اصلاح کنید.
- به طور خودکار خاک ، لکه ها ، خراش ها ، درخشش ، شیب ناخواسته و سایر انواع سر و صدا را از بین ببرید.
- کنتراست تصویر را بطور خودکار تنظیم کنید.
- به صورت خودکار مجلل یا به صورت دستی تصویر را تغییر اندازه دهید.
- تصاویر را به مقیاس سیاه و سفید یا خاکستری تبدیل کنید.
- رنگ های معکوس ، باعث می شود مناطق سبک به نظر می رسند و مناطق تاریک به نظر می رسند.
- ضخامت شخصیت ها را در یک تصویر افزایش دهید.
- تصاویر پر سر و صدا هنگام حفظ لبه های نامه.
- در عکس های صفحه ، صفحه را صاف کنید و اعوجاج لنز دوربین را صحیح کنید.
API های مشخص شده برای انواع مختلف اسناد
Aspose.ocr for Python از طریق جاوا شبکه های عصبی ویژه ای را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:
- کارتهای شناسایی و گذرنامه اسکن شده یا عکاسی.
- پلاک های مجوز وسیله نقلیه.
- فاکتورها
- رسیدها
داخلی طلسم داخلی
اگرچه Aspose.ocr for Python از طریق جاوا دقت شناخت بالایی را ارائه می دهد ، نقص چاپ ، خاک یا قلم های غیر استاندارد ممکن است باعث شود شخصیت ها یا کلمات خاصی به طور نادرست تشخیص داده شوند. برای بهبود بیشتر نتایج تشخیص ، می توانید طلسم را روشن کنید ، که خطاهای املایی را بر اساس زبان تشخیص انتخاب شده پیدا کرده و به طور خودکار اصلاح می کند.
اگر متن شناخته شده حاوی اصطلاحات تخصصی ، اختصارات و کلمات دیگر باشد که در فرهنگ لغت های املایی مشترک وجود ندارد ، می توانید لیست های کلمه خود را ارائه دهید.
شناخت دسته ای کارآمد
Python OCR API ما به شما این امکان را می دهد تا تشخیص تصویر را ساده کنید. از روشهای پردازش دسته ای همه کاره برای پردازش کارآمد چندین تصویر در یک تماس استفاده کنید:
- PDF چند صفحه ای ، پرونده های TIFF را تشخیص دهید.
- همه پرونده ها را در یک پوشه پردازش کنید.
- شناخت همه پرونده ها را در یک بایگانی انجام دهید.
- تصاویر را از یک لیست مشخص تشخیص دهید.
یادگیری از طریق نمونه های پایتون
انواع نمونه های پایتون را کاوش کنید تا به شما کمک کند تا به سرعت عملکردها و توانایی های راه حل OCR ما را درک کنید. به سرعت در مورد ایجاد راه حل های سفارشی که نیازهای تجاری خاص شما را برآورده می کند ، به سرعت به دست آورید.
ویژگی ها و قابلیت ها
Aspose.OCR for Python via Java ویژگی های پیشرفته aspose.ocr را برای پایتون کاوش کنید
عکس OCR
متن را از عکس های تلفن هوشمند با دقت در سطح اسکن استخراج کنید.
PDF قابل جستجو
هر اسکن را به یک سند کاملاً قابل جستجو و شاخص تبدیل کنید.
شناخت URL
بدون بارگیری در محلی ، تصویری را از URL تشخیص دهید.
شناخت انبوه
تمام تصاویر را از اسناد ، پوشه ها و بایگانی های چند صفحه ای بخوانید.
هر قلم و سبک
متن را در همه نوع و سبک های محبوب شناسایی و تشخیص دهید.
شناخت تنظیم دقیق
هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.
طلسم طلسم
با اصلاح خودکار کلمات غلط املایی ، نتایج را بهبود بخشید.
متن را در تصاویر پیدا کنید
متن یا بیان منظم را در مجموعه ای از تصاویر جستجو کنید.
متون تصویر را مقایسه کنید
متون را بدون در نظر گرفتن مورد و چیدمان بر روی دو تصویر مقایسه کنید.
نمونه کد پایتون
نمونه های کد را برای ادغام یکپارچه aspose.ocr for Python از طریق جاوا در برنامه های خود کشف کنید.
نصب بی دردسر
به عنوان یک بسته پایتون یا یک فایل قابل بارگیری با حداقل وابستگی ، به عنوان aspose.ocr for python از طریق جاوا ، توزیع آسان را تضمین می کند. آن را مستقیماً از پایتون در پروژه خود ادغام کنید ، و شما آماده هستید تا از قابلیت های کامل OCR استفاده کنید ، و نتایج تشخیص را در قالب های مختلف ذخیره می کنید. مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از این دوره برای شروع توسعه یک برنامه OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد تصمیم آگاهانه ای در مورد خرید aspose.ocr برای پایتون از طریق جاوا بگیرید.
مجوز بار
lic = License()
lic.set_license(self.licPath)
شناخت تصویر
چالش اصلی در برنامه های OCR کمبود اسکنر برای کاربران نهایی است. API ما ، که به طور یکپارچه با پایتون از طریق جاوا یکپارچه شده است ، دارای فیلترهای پیش پردازش تصویر داخلی قوی است که تصاویر چرخشی ، چسبناک و پر سر و صدا را کنترل می کند. همراه با پشتیبانی از همه قالب های تصویر ، این امکان را برای تشخیص قابل اعتماد ، حتی از عکس های تلفن هوشمند فراهم می کند. بیشتر پردازش و تصحیح تصویر خودکار هستند و فقط در موارد چالش برانگیز به مداخله شما نیاز دارند.
اصلاحات خودکار تصویر را اعمال کنید - پایتون
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
مبدل جهانی پایتون
API ما به طور دقیق هر تصویری را از اسکنرها ، دوربین ها یا تلفن های هوشمند می خواند: اسناد PDF ، JPEG ، PNG ، TIFF ، GIF ، BMP. پشتیبانی کامل از اسناد PDF چند صفحه ای ، تصاویر TIFF و DJVU تطبیق پذیری را تضمین می کند. همچنین می توانید از طریق URL تصویری از وب ارائه دهید.
نتایج تشخیص در قالب های محبوب اسناد و تبادل داده بازگردانده می شود: متن ساده ، PDF ، Microsoft Word ، Microsoft Excel ، JSON و XML.
PDF را بشناسید و نتایج را در قالب های مختلف خروجی ذخیره کنید - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
بهینه سازی استفاده از منابع
OCR یک الگوریتم تشخیص ویژه برای استخراج محتوا از تصاویر با متن پراکنده و پس زمینه های پر سر و صدا/رنگی ارائه می دهد. این روش به طور قابل توجهی دقت OCR را در موارد تجاری زیر بهبود می بخشد:
- متن را از عکس های خیابانی بخوانید.
- بخش و شناسایی علائم جاده ای و تابلوهای داخل تصاویر خیابانی.
- برچسب های قیمت را پیدا کرده و متن استخراج شده را به عنوان قیمت تفسیر کنید.
- مناطق مورد علاقه خود را در برچسب های مواد غذایی ، مانند اطلاعات تغذیه ای یا لیست مواد تشکیل دهنده پیدا کرده و جمع کنید.
- پلاک های اتومبیل را شناسایی و تجزیه و تحلیل کنید.
- متن را از منوها و کاتالوگ ها استخراج کنید.
منطقه باز OCR - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
استخراج متن از عکس های خیابانی
OCR برای Python یک الگوریتم تشخیص ویژه ارائه می دهد که متن را از پلاک های خودرو ، از جمله عکس های تاریک و مبهم استخراج می کند. متن حاصل می تواند به طور خودکار در پایگاه داده ذخیره شود یا به طور خودکار تأیید شود.
شماره ماشین را تشخیص دهید - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)