تبدیل تصویر به متن با Python OCR API از طریق جاوا
تشخیص متن در تصاویر با پایتون
ویترین های بیشتر ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
چرا Aspose.OCR برای پایتون از طریق جاوا؟
Aspose.OCR برای پایتون از طریق جاوا به طور یکپارچه قابلیتهای قدرتمند تشخیص کاراکتر نوری (OCR) را در نوتبوکها و برنامههای کاربردی پایتون چند پلتفرمی ادغام میکند. با API بصری و پرسرعت ما، میتوانید متن را از اسکنها، اسکرینشاتها، لینکهای وب، یا عکسهای گوشیهای هوشمند بدون زحمت استخراج کنید و نتایجی را ارائه دهید که برای ادغام، تجزیه و تحلیل یا ذخیرهسازی آماده هستند. تصاویر اسکن شده، عکس های گوشی هوشمند، اسکرین شات ها و پی دی اف های اسکن شده را بشناسید و نتایج را در قالب های سند محبوب ذخیره کنید. فیلترهای پیش پردازش پیشرفته تصاویر چرخان، کج و نویز را کنترل می کنند. عملکرد را با بارگیری وظایف در GPU بهینه کنید.
OCR سریع و دقیق
با پایتون پیشرفته ما از طریق فناوری جاوا به نتایج OCR با سرعت بالا و دقیق برسید.
پشتیبانی چند زبانه
متن را به بیش از 130 زبان، از جمله لاتین، سیریلیک، عربی، فارسی، هندی، و اسکریپت چینی تشخیص دهید و از تطبیق پذیری برنامه های پایتون خود از طریق جاوا اطمینان حاصل کنید.
پشتیبانی از تصویر انعطاف پذیر
تصاویر اسکنرها، دوربینها و گوشیهای هوشمند را بهطور یکپارچه با پایتون از طریق جاوا پردازش کنید.
دقت در تشخیص کاراکتر چینی
بیش از 6000 کاراکتر چینی را با دقت در پروژه های پایتون خود از طریق جاوا تشخیص دهید.
حفظ سبک فونت و قالب بندی
سبکهای فونت و قالببندی را برای نمایش دقیق متن شناخته شده در برنامههای پایتون خود از طریق جاوا حفظ کنید.
نمونه کد زنده
تشخیص متن را از تصاویر تنها در سه خط کد آغاز کنید. سادگی را تجربه کنید!
* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.
تبدیل تصویر به متن
نمونه های بیشتر ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
ترجیح خود را انتخاب کنید
کتابخانه مناسب برای نیازهای خود را انتخاب کنید. API های موجود و قابلیت های آنها را برای انتخاب کارآمدترین راه حل کاوش کنید.
تطبیق پذیری
Python via .NET
یکنواختی
Python via Java
عملکرد
Python via C++
سازگاری با Backend جاوا
کتابخانه ما که بهعنوان یک ماژول پایتون طراحی شده است، سازگاری با سیستمعاملهای اصلی را که جاوا را پشتیبانی میکنند - از جمله Microsoft Windows، Linux، و macOS، یا پلتفرم های ابری این به شما امکان می دهد برنامه ها را بر روی یک پلتفرم توسعه دهید و آنها را به طور یکپارچه روی پلتفرم دیگری اجرا کنید و نیازی به هرگونه تغییر کد را از بین ببرد.
فرمت های فایل پشتیبانی شده
Aspose.OCR for Python via Java می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.
تصاویر
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR دسته ای
- Multi-page PDF
- ZIP
- Folder
نتایج شناسایی
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
نصب بدون دردسر پایتون از طریق جاوا
Aspose.OCR برای پایتون از طریق جاوا به عنوان یک بسته پایتون یا به عنوان یک فایل قابل دانلود با حداقل وابستگی تحویل داده می شود. به راحتی آن را در پروژه خود نصب کنید و آماده تشخیص متون در چندین زبان پشتیبانی شده و ذخیره نتایج تشخیص در قالبهای مختلف هستید.
درخواست مجوز آزمایشی برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی بدون محدودیت.
OCR قدرتمند برای برنامه های کاربردی پایتون
کتابخانه ما به راحتی ادغام می شود و برنامه های پایتون را قادر می سازد تا به طور یکپارچه بر روی هر پلتفرمی اجرا شوند - ویندوز دسکتاپ، ویندوز سرور، macOS، لینوکس و ابر.
130+ زبان تشخیص
Python و Java OCR API ما تعداد زیادی از زبانها و اسکریپتهای نوشتاری محبوب، از جمله زبانهای ترکیبی را میشناسد:
تشخیص زبان را به کتابخانه بسپارید یا خودتان زبان را برای بهبود عملکرد تشخیص و قابلیت اطمینان تعریف کنید.
- ** الفبای لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
- ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، صربی، بلاروسی، بلغاری؛
- عربی، فارسی، اردو؛
- خط چینی و دوانگاری، از جمله هندی، مراتی، بوجپوری، و دیگران.
فیلترهای پردازش تصویر پیشرفته
دقت تشخیص کاراکتر نوری به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose.OCR برای پایتون از طریق جاوا مجموعه وسیعی از فیلترهای پردازش خودکار و دستی تصویر را برای بهینه سازی تصویر قبل از ارسال به موتور OCR ارائه می دهد:
- به طور خودکار تصاویر کمی کج شده را صاف کنید.
- چرخش تصاویر با انحراف شدید را به صورت دستی اصلاح کنید.
- به طور خودکار کثیفی، لکه ها، خراش ها، تابش خیره کننده، شیب های ناخواسته، و انواع دیگر صداها را حذف کنید.
- کنتراست تصویر را به صورت خودکار تنظیم کنید.
- اندازه تصویر را به صورت خودکار یا دستی تغییر دهید.
- تصاویر را به سیاه و سفید یا خاکستری تبدیل کنید.
- رنگ های تصویر را معکوس کنید، مناطق روشن را تاریک و مناطق تاریک را روشن نشان دهید.
- ضخامت کاراکترها را در یک تصویر افزایش دهید.
- با حفظ لبه های حروف، تصاویر پر سر و صدا را تار کنید.
- انحراف صفحه را صاف کنید و اعوجاج لنز دوربین را در عکس های صفحه اصلاح کنید.
API های اختصاصی برای انواع سند
Aspose.OCR برای پایتون از طریق جاوا شبکه های عصبی آموزش دیده ای را برای استخراج متن از انواع خاصی از تصاویر با حداکثر دقت ارائه می دهد:
- کارت های شناسایی و پاسپورت های اسکن شده یا عکس گرفته شده.
- پلاک خودرو.
- فاکتورها
- رسیدها
غلطگیر املای داخلی
اگرچه Aspose.OCR برای پایتون از طریق جاوا دقت تشخیص بالایی را ارائه میکند، نقص چاپ، کثیفی یا فونتهای غیر استاندارد ممکن است باعث شود برخی از کاراکترها یا کلمات به اشتباه تشخیص داده شوند. برای بهبود بیشتر نتایج تشخیص، میتوانید غلطگیر املا را روشن کنید، که خطاهای املایی را براساس زبان تشخیص انتخابشده پیدا کرده و بهطور خودکار تصحیح میکند.
اگر متن شناسایی شده حاوی اصطلاحات تخصصی، اختصارات و کلمات دیگری است که در فرهنگ لغت های املایی رایج وجود ندارد، می توانید فهرست کلمات خود را ارائه دهید.
تشخیص دسته ای کارآمد
Python OCR API ما به شما امکان می دهد تا تشخیص تصویر را ساده کنید. از روش های پردازش دسته ای همه کاره برای پردازش کارآمد چندین تصویر در یک تماس استفاده کنید:
- تشخیص فایل های PDF چند صفحه ای، TIFF.
- تمام فایل های داخل یک پوشه را پردازش کنید.
- تشخیص دسته برای همه فایل های یک آرشیو.
- تشخیص تصاویر از یک لیست مشخص.
یادگیری از طریق مثال های پایتون
انواع نمونههای Python را که برای کمک به شما در درک سریع عملکردها و قابلیتهای راهحل OCR ما طراحی شدهاند، کاوش کنید. به سرعت در مورد ایجاد راه حل های سفارشی که نیازهای خاص کسب و کار شما را برآورده می کند بینش به دست آورید.
ویژگی ها و قابلیت ها
Aspose.OCR for Python via Java ویژگی های پیشرفته Aspose.OCR برای پایتون را کاوش کنید
عکس OCR
استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.
PDF قابل جستجو
هر اسکن را به یک سند کاملاً قابل جستجو و فهرستبندی تبدیل کنید.
تشخیص URL
تشخیص تصویر از URL بدون بارگیری محلی.
تشخیص انبوه
تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.
هر نوع فونت و سبک
متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.
تشخیص دقیق
هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.
غلط گیر املا
با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.
متن را در تصاویر پیدا کنید
متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.
متن های تصویری را با هم مقایسه کنید
متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.
نمونه کدهای پایتون
برای ادغام یکپارچه Aspose.OCR برای Python از طریق جاوا در برنامه های خود، نمونه های کد را کشف کنید.
نصب بدون زحمت
به عنوان یک بسته پایتون یا یک فایل قابل دانلود با حداقل وابستگی، Aspose.OCR برای پایتون از طریق جاوا توزیع آسان را تضمین می کند. آن را مستقیماً از پایتون در پروژه خود ادغام کنید، و آماده می شوید که از قابلیت های OCR کامل استفاده کنید و نتایج تشخیص را در قالب های مختلف ذخیره کنید.
پس از نصب، فوراً استفاده از Aspose.OCR برای پایتون را از طریق جاوا شروع کنید. هر چند با محدودیت های خاص یک مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از این دوره برای شروع توسعه یک برنامه کاربردی OCR کاملاً کاربردی استفاده کنید و به شما امکان می دهد بعداً تصمیمی آگاهانه در مورد خرید Aspose.OCR برای پایتون از طریق جاوا بگیرید.
مجوز بارگیری
lic = License()
lic.set_license(self.licPath)
تشخیص تصویر
چالش اصلی در برنامه های OCR، کمبود اسکنر برای کاربران نهایی است. API ما که به طور یکپارچه با پایتون از طریق جاوا ادغام شده است، دارای فیلترهای پیش پردازش تصویر داخلی قوی است که تصاویر چرخان، کج و نویز را مدیریت می کند. همراه با پشتیبانی از همه فرمت های تصویر، امکان تشخیص قابل اعتماد، حتی از عکس های گوشی هوشمند را فراهم می کند. اکثر پیش پردازش ها و تصحیح تصویر خودکار هستند و فقط در موارد چالش برانگیز به مداخله شما نیاز دارند.
اعمال تصحیح خودکار تصویر - پایتون
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
مبدل جهانی پایتون
API ما هر تصویری را از اسکنرها، دوربینها یا گوشیهای هوشمند میخواند: اسناد PDF، JPEG، PNG، TIFF، GIF، فایلهای BMP. پشتیبانی کامل از اسناد PDF چند صفحه ای، تصاویر TIFF و DjVu تطبیق پذیری را تضمین می کند. شما همچنین می توانید یک تصویر از وب از طریق یک URL ارائه دهید.
نتایج تشخیص در قالبهای رایج تبادل اسناد و دادهها برگردانده میشود: متن ساده، PDF، Microsoft Word، Microsoft Excel، JSON، و XML.
PDF را بشناسید و نتایج را در فرمت های خروجی مختلف ذخیره کنید - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
بهینه سازی استفاده از منابع
OCR یک الگوریتم تشخیص ویژه برای استخراج محتوا از تصاویر با متن کم و پس زمینه های پر سر و صدا/رنگی ارائه می دهد. این روش به طور قابل توجهی دقت OCR را در موارد تجاری زیر بهبود می بخشد:
- متن از عکس های خیابان را بخوانید.
- بخش بندی و شناسایی علائم جاده و تابلوهای راهنما در تصاویر خیابان.
- برچسب های قیمت را پیدا کنید و متن استخراج شده را به عنوان قیمت تفسیر کنید.
- مناطق مورد علاقه را در برچسب های مواد غذایی، مانند اطلاعات تغذیه ای یا لیست مواد تشکیل دهنده، پیدا کرده و جمع آوری کنید.
- شناسایی و تجزیه و تحلیل پلاک خودرو.
- متن را از منوها و کاتالوگ ها استخراج کنید.
OCR ناحیه باز - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
استخراج متن از عکس های خیابانی
OCR برای پایتون یک الگوریتم تشخیص ویژه ارائه می دهد که متن را از پلاک خودروها، از جمله عکس های تیره و تار استخراج می کند. سپس متن به دست آمده می تواند به طور خودکار در پایگاه داده ذخیره شود یا به طور خودکار تأیید شود.
تشخیص شماره ماشین - پایتون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)