قم بتحويل الصورة إلى نص باستخدام Python OCR API عبر Java
التعرف على النص في الصور مع Python
المزيد من العروض ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
لماذا aspose.ocr للبيثون عبر جافا؟
ASPOSE.OCR لـ Python عبر Java يدمج بسلاسة إمكانيات التعرف على الأحرف البصري القوية (OCR) في دفاتر وتطبيقات Python المتقاطعة. من خلال واجهة برمجة تطبيقاتنا البديهية والعالية السرعة ، يمكنك استخراج النص دون عناء من عمليات الفحص أو لقطات الشاشة أو روابط الويب أو صور الهواتف الذكية ، وتقديم نتائج جاهزة للتوحيد أو التحليل أو التخزين. التعرف على الصور الممسوحة ضوئيًا وصور الهواتف الذكية ولقطات الشاشة و PDFs الممسوحة ضوئيًا ، وتوفير النتائج في تنسيقات المستندات الشائعة. تعامل مرشحات المعالجة المسبقة المتقدمة مع الصور المدورة والمنحرفة والصاخبة. تحسين الأداء عن طريق تفريغ المهام إلى وحدة معالجة الرسومات.

سريع ودقيق OCR
تحقيق نتائج عالية السرعة ودقيقة على الحروف التعريفي مع Python المتقدمة عبر تقنية Java.
دعم متعدد اللغات
التعرف على النص في أكثر من 140 لغة ، بما في ذلك البرامج النصية اللاتينية والسيليك والعربية والفارسية ، المؤشر ، والصينية ، وضمان التنوع لتطبيقات Python الخاصة بك عبر Java.
دعم صورة مرن
معالجة الصور من الماسحات الضوئية والكاميرات والهواتف الذكية بسلاسة مع بيثون عبر جافا.
الدقة في التعرف على الشخصية الصينية
تعرف على أكثر من 6000 حرف صيني بدقة في مشاريع بيثون عبر جافا.
الحفاظ على أنماط الخطوط والتنسيق
الحفاظ على أنماط الخطوط وتنسيق التمثيل الدقيق للنص المعترف به في تطبيقات Python الخاصة بك عبر Java.
عينة الكود المباشر
بدء التعرف على النص من الصور في ثلاثة أسطر فقط من التعليمات البرمجية. تجربة البساطة!
* عن طريق تحميل ملفاتك أو استخدام الخدمة التي توافق عليها شروط الاستخدام و سياسة الخصوصية.
تحويل الصورة إلى نص
المزيد من الأمثلة ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
اختر تفضيلاتك
اختر المكتبة المناسبة لاحتياجاتك. استكشف واجهات برمجة التطبيقات المتاحة وقدراتها لتحديد الحل الأكثر كفاءة.
التنوع
Python via .NET
التوحيد
Python via Java
أداء
Python via C++
جافا الخلفية التوافق
تم تصميم مكتبتنا كوحدة Python ، وتضمن التوافق عبر أنظمة التشغيل الرئيسية الداعمة Java - بما في ذلك Microsoft Windows و Linux و MacOs ، أو المنصات السحابية. يمكّنك ذلك من تطوير تطبيقات على منصة واحدة وتشغيلها بسلاسة على آخر ، مما يلغي الحاجة إلى أي تعديلات رمز.
تنسيقات الملف المدعومة
Aspose.OCR for Python via Java يمكن أن تعمل مع أي ملف يمكنك الحصول على الماسح الضوئي أو الكاميرا. يمكن حفظ نتائج الاعتراف أو استيرادها إلى قاعدة بيانات أو تحليلها في الوقت الفعلي.
الصور
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
دفعة OCR
- Multi-page PDF
- ZIP
- Folder
نتائج التعرف
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
تركيب بدون جهد لبيثون عبر جافا
يتم تسليم Aspose.ocr for Python عبر Java كحزمة Python أو كملف قابل للتنزيل]( https://release.aspose.com/ocr/python-java/ ) مع الحد الأدنى من التبعيات. بسهولة تثبيت في مشروعك ، وأنت مستعد للتعرف على النصوص بلغات متعددة مدعومة وحفظ نتائج التعرف على تنسيقات مختلفة.
اطلب ترخيصًا تجريبيًا لبدء تطوير تطبيق OCR يعمل بشكل كامل دون قيود.
OCR قوي لتطبيقات Python
تدمج مكتبتنا بسهولة ، مما يتيح تطبيقات Python لتشغيلها بسلاسة على أي منصة - Windows Windows و Windows Server و MacOs و Linux و Cloud.
140+ لغات التعرف
يتعرف Python و Java OCR API على عدد كبير من اللغات ونصوص الكتابة الشعبية ، بما في ذلك اللغات المختلطة:
اترك الكشف عن اللغة إلى المكتبة أو حدد اللغة بنفسك لتعزيز أداء وموثوقية التعرف.
- ** اللاتينية الممتدة ** الأبجدية: الإنجليزية والإسبانية والفرنسية والإندونيسية والبرتغالية والألمانية والفيتنامية والتركية والإيطالية والبولندية و 80+ أخرى ؛
- ** السيريليك ** الأبجدية: الروسية ، الأوكرانية ، كازاخاخية ، صربي ، بيلاروسيا ، البلغارية ؛
- العربية ، الفارسية ، الأردية ؛
- السيناريو الصيني و Devanagari ، بما في ذلك الهندية والماراثي و Bhojpuri وغيرها.
مرشحات معالجة الصور المحسنة
تعتمد دقة التعرف على الأحرف البصرية اعتمادًا كبيرًا على جودة الصورة الأصلية. يقدم Aspose.ocr for Python عبر Java مجموعة واسعة من كل من مرشحات معالجة الصور الآلية واليدوية لتحسين صورة قبل التقديم إلى محرك OCR:
- تصويب الصور المائلة قليلاً.
- يصحح يدويًا دوران الصور المنحرفة بشدة.
- قم بإزالة الأوساخ والبقع والخدوش والوهج والتدرجات غير المرغوب فيها تلقائيًا وأنواع أخرى من الضوضاء.
- ضبط تباين الصورة تلقائيا.
- راقية تلقائيًا أو تغيير حجم الصورة يدويًا.
- تحويل الصور إلى أبيض وأسود أو رمادي.
- انقلب ألوان الصورة ، وجعل المناطق الخفيفة تبدو مناطق مظلمة ومظلمة تظهر الضوء.
- زيادة سمك الأحرف في الصورة.
- طمس الصور صاخبة مع الحفاظ على حواف الحروف.
- قم بتصويب الصفحة المنحرفة وتصحيح تشويه عدسة الكاميرا في صور الصفحة.
واجهات برمجة التطبيقات المحددة لمختلف أنواع المستندات
يقدم Aspose.ocr for Python عبر Java شبكات عصبية مدربة خصيصًا لاستخراج النص من أنواع معينة من الصور ذات الدقة القصوى:
- بطاقات الهوية الممسوحة ضوئيًا أو تم تصويرها.
- لوحات ترخيص المركبات.
- فواتير.
- الإيصالات.
مدقق إملائي مدمج
على الرغم من أن Aspose.ocr for Python عبر Java يوفر دقة عالية التعرف ، فإن عيوب الطباعة أو الأوساخ أو الخطوط غير القياسية قد تتسبب في التعرف على شخصيات أو كلمات معينة بشكل غير صحيح. لتحسين نتائج التعرف ، يمكنك تشغيل المدقق الإملائي ، الذي يجد ويصحح أخطاء الإملاء وتؤدي تلقائيًا بناءً على لغة التعرف المحددة.
إذا كان النص المعترف به يحتوي على مصطلحات متخصصة ، اختصارات ، وكلمات أخرى غير موجودة في قواميس الإملاء المشتركة ، يمكنك توفير قوائم الكلمات الخاصة بك.
الاعتراف بكفاءة الدفعة
تمكنك Python OCR API من تبسيط التعرف على الصور. الاستفادة من أساليب معالجة الدُفعات متعددة الاستخدامات للمعالجة الفعالة لصور متعددة في مكالمة واحدة:
- التعرف على ملفات PDF متعددة الصفحات ، TIFF.
- معالجة جميع الملفات داخل مجلد.
- التعامل مع التعرف على جميع الملفات في الأرشيف.
- التعرف على الصور من قائمة محددة.
التعلم عبر أمثلة بيثون
استكشف مجموعة متنوعة من Python Ampects المصممة لمساعدتك في فهم وظائف وقدرات حل OCR بسرعة. اكتساب نظرة ثاقبة بسرعة على إنشاء حلول مخصصة تلبي متطلبات عملك المحددة.
الميزات والقدرات
Aspose.OCR for Python via Java استكشف الميزات المتقدمة لـ ASPOSE.OCR للبيثون
الصورة OCR
استخراج النص من صور الهاتف الذكي بدقة مستوى المسح.
PDF قابل للبحث
تحويل أي فحص إلى مستند قابل للبحث بالكامل وقابل للفهرسة.
التعرف على عنوان URL
تعرف على صورة من عنوان URL دون تنزيلها محليًا.
الاعتراف بالجملة
اقرأ جميع الصور من المستندات والمجلدات والأرشيفات متعددة الصفحات.
أي خط وأسلوب
تحديد النص والتعرف عليه في جميع المحارف والأنماط الشائعة.
الاعتراف بالضبط
اضبط كل معلمة OCR للحصول على أفضل نتائج التعرف.
المدقق الإملائي
تحسين النتائج عن طريق تصحيح الكلمات الإملائية تلقائيًا.
ابحث عن نص في الصور
ابحث عن النص أو التعبير العادي داخل مجموعة من الصور.
قارن نصوص الصور
قارن النصوص على صورتين ، بغض النظر عن الحالة والتخطيط.
عينات رمز بيثون
اكتشف عينات رمز لدمجها بسلاسة Aspose.ocr للبيثون عبر Java في تطبيقاتك.
التثبيت دون عناء
كحزمة Python أو ملف قابل للتنزيل مع الحد الأدنى من التبعيات ، يضمن Aspose.ocr لـ Python عبر Java التوزيع السهل. قم بدمجه في مشروعك مباشرة من Python ، وأنت على استعداد للاستفادة من إمكانات التعرف على الحروف الكاملة ، وتوفير نتائج التعرف على تنسيقات مختلفة.
بعد التثبيت ، تبدأ على الفور باستخدام Aspose.ocr للبيثون عبر Java ، وإن كان ذلك مع بعض القيود. يزيل الترخيص المؤقت جميع قيود الإصدار التجريبي لمدة 30 يومًا. استخدم هذه الفترة لبدء تطوير تطبيق OCR يعمل بكامل طاقته ، مما يتيح لك اتخاذ قرار مستنير بشأن شراء Aspose.ocr لـ Python عبر Java لاحقًا.
رخصة التحميل
lic = License()
lic.set_license(self.licPath)
التعرف على الصور
التحدي الأساسي في تطبيقات OCR هو ندرة الماسحات الضوئية للمستخدمين النهائيين. تتميز واجهة برمجة التطبيقات الخاصة بنا ، المدمجة بسلاسة مع Python عبر Java ، إلى مرشحات قوية للمعالجة المدمجة معالجة الصور المدورة والمنحرفة والصاخبة. جنبا إلى جنب مع الدعم لجميع تنسيقات الصور ، فإنه يتيح التعرف الموثوق ، حتى من صور الهاتف الذكي. معظم المعالجة المسبقة وتصحيح الصور مؤتمتة ، مما يتطلب تدخلك فقط في الحالات الصعبة.
تطبيق تصحيحات الصور التلقائية - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
بيثون المحول العالمي
يقرأ واجهة برمجة التطبيقات الخاصة بنا أي صورة من الماسحات الضوئية أو الكاميرات أو الهواتف الذكية: مستندات PDF ، JPEG ، PNG ، TIFF ، GIF ، BMP. يضمن الدعم الكامل لمستندات PDF متعددة الصفحات ، TIFF ، و DJVU براعة. يمكنك أيضًا تقديم صورة من الويب عبر عنوان URL.
يتم إرجاع نتائج التعرف في تنسيقات مستندات وتبادل البيانات الشائعة: نص عادي ، PDF ، Microsoft Word ، Microsoft Excel ، JSON ، و XML.
التعرف على PDF وحفظ النتائج لتنسيقات الإخراج المختلفة - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
تحسين استخدام الموارد
يوفر OCR خوارزمية التعرف الخاصة لاستخراج المحتوى من الصور ذات النص المتناثر والخلفيات الصاخبة/الملونة. هذه الطريقة تعمل بشكل كبير على تحسين دقة التعرف الضوئي على الحروف في حالات العمل التالية:
- اقرأ النص من صور الشارع.
- قطاع وتحديد علامات الطرق وألواح اللافتات داخل صور الشوارع.
- تحديد علامات الأسعار وتفسير النص المستخرج كأسعار.
- ابحث عن المناطق المثيرة للاهتمام وتجميعها على ملصقات الأغذية ، مثل المعلومات الغذائية أو قوائم المكونات.
- تحديد وتحليل لوحات ترخيص السيارة.
- استخراج النص من القوائم والكتالوجات.
المنطقة المفتوحة OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
استخراج النص من صور الشارع
يوفر OCR لـ Python خوارزمية اعتراف خاصة تستخرج النص من لوحات ترخيص المركبات ، بما في ذلك الصور المظلمة والضبابية. يمكن بعد ذلك حفظ النص الناتج تلقائيًا في قاعدة البيانات أو التحقق تلقائيًا.
التعرف على رقم السيارة - بيثون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)