لماذا aspose.ocr للبيثون عبر جافا؟

ASPOSE.OCR لـ Python عبر Java يدمج بسلاسة إمكانيات التعرف على الأحرف البصري القوية (OCR) في دفاتر وتطبيقات Python المتقاطعة. من خلال واجهة برمجة تطبيقاتنا البديهية والعالية السرعة ، يمكنك استخراج النص دون عناء من عمليات الفحص أو لقطات الشاشة أو روابط الويب أو صور الهواتف الذكية ، وتقديم نتائج جاهزة للتوحيد أو التحليل أو التخزين. التعرف على الصور الممسوحة ضوئيًا وصور الهواتف الذكية ولقطات الشاشة و PDFs الممسوحة ضوئيًا ، وتوفير النتائج في تنسيقات المستندات الشائعة. تعامل مرشحات المعالجة المسبقة المتقدمة مع الصور المدورة والمنحرفة والصاخبة. تحسين الأداء عن طريق تفريغ المهام إلى وحدة معالجة الرسومات.

Illustration ocr

سريع ودقيق OCR

تحقيق نتائج عالية السرعة ودقيقة على الحروف التعريفي مع Python المتقدمة عبر تقنية Java.

دعم متعدد اللغات

التعرف على النص في أكثر من 140 لغة ، بما في ذلك البرامج النصية اللاتينية والسيليك والعربية والفارسية ، المؤشر ، والصينية ، وضمان التنوع لتطبيقات Python الخاصة بك عبر Java.

دعم صورة مرن

معالجة الصور من الماسحات الضوئية والكاميرات والهواتف الذكية بسلاسة مع بيثون عبر جافا.

الدقة في التعرف على الشخصية الصينية

تعرف على أكثر من 6000 حرف صيني بدقة في مشاريع بيثون عبر جافا.

الحفاظ على أنماط الخطوط والتنسيق

الحفاظ على أنماط الخطوط وتنسيق التمثيل الدقيق للنص المعترف به في تطبيقات Python الخاصة بك عبر Java.

عينة الكود المباشر

بدء التعرف على النص من الصور في ثلاثة أسطر فقط من التعليمات البرمجية. تجربة البساطة!

على استعداد للاعتراف على استعداد للاعتراف إسقاط ملف هنا أو انقر لتصفح *

* عن طريق تحميل ملفاتك أو استخدام الخدمة التي توافق عليها شروط الاستخدام و سياسة الخصوصية.

نتيجة الاعتراف
 

تحويل الصورة إلى نص

المزيد من الأمثلة >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

اختر تفضيلاتك

اختر المكتبة المناسبة لاحتياجاتك. استكشف واجهات برمجة التطبيقات المتاحة وقدراتها لتحديد الحل الأكثر كفاءة.

التنوع

Python via .NET

سهولة التطوير ، قابلية القراءة ، وصيانة الكود
يضم معظم الميزات ويتلقى التحديثات الأكثر شيوعًا
قد تكون السرعة الإجمالية أبطأ قليلاً من المنصات الأخرى

التوحيد

Python via Java

استخدم نفس المكتبة على أي منصة
قم بتشغيل تطبيقك بسلاسة على أي جهاز
يتطلب إصدار Java Runtime Environment (JRE) 8 أو أحدث

أداء

Python via C++

أسرع سرعة ممكنة بغض النظر عن المنصة
قدر كبير من السيطرة على إدارة الموارد
يستهدف المطورين ذوي الخبرة

جافا الخلفية التوافق

تم تصميم مكتبتنا كوحدة Python ، وتضمن التوافق عبر أنظمة التشغيل الرئيسية الداعمة Java - بما في ذلك Microsoft Windows و Linux و MacOs ، أو المنصات السحابية. يمكّنك ذلك من تطوير تطبيقات على منصة واحدة وتشغيلها بسلاسة على آخر ، مما يلغي الحاجة إلى أي تعديلات رمز.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

تنسيقات الملف المدعومة

Aspose.OCR for Python via Java يمكن أن تعمل مع أي ملف يمكنك الحصول على الماسح الضوئي أو الكاميرا. يمكن حفظ نتائج الاعتراف أو استيرادها إلى قاعدة بيانات أو تحليلها في الوقت الفعلي.

الصور

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

دفعة OCR

  • Multi-page PDF
  • ZIP
  • Folder

نتائج التعرف

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

تركيب بدون جهد لبيثون عبر جافا

يتم تسليم Aspose.ocr for Python عبر Java كحزمة Python أو كملف قابل للتنزيل]( https://release.aspose.com/ocr/python-java/ ) مع الحد الأدنى من التبعيات. بسهولة تثبيت في مشروعك ، وأنت مستعد للتعرف على النصوص بلغات متعددة مدعومة وحفظ نتائج التعرف على تنسيقات مختلفة.

اطلب ترخيصًا تجريبيًا لبدء تطوير تطبيق OCR يعمل بشكل كامل دون قيود.

OCR قوي لتطبيقات Python

تدمج مكتبتنا بسهولة ، مما يتيح تطبيقات Python لتشغيلها بسلاسة على أي منصة - Windows Windows و Windows Server و MacOs و Linux و Cloud.

140+ لغات التعرف

يتعرف Python و Java OCR API على عدد كبير من اللغات ونصوص الكتابة الشعبية ، بما في ذلك اللغات المختلطة:

اترك الكشف عن اللغة إلى المكتبة أو حدد اللغة بنفسك لتعزيز أداء وموثوقية التعرف.

  • ** اللاتينية الممتدة ** الأبجدية: الإنجليزية والإسبانية والفرنسية والإندونيسية والبرتغالية والألمانية والفيتنامية والتركية والإيطالية والبولندية و 80+ أخرى ؛
  • ** السيريليك ** الأبجدية: الروسية ، الأوكرانية ، كازاخاخية ، صربي ، بيلاروسيا ، البلغارية ؛
  • العربية ، الفارسية ، الأردية ؛
  • السيناريو الصيني و Devanagari ، بما في ذلك الهندية والماراثي و Bhojpuri وغيرها.

مرشحات معالجة الصور المحسنة

تعتمد دقة التعرف على الأحرف البصرية اعتمادًا كبيرًا على جودة الصورة الأصلية. يقدم Aspose.ocr for Python عبر Java مجموعة واسعة من كل من مرشحات معالجة الصور الآلية واليدوية لتحسين صورة قبل التقديم إلى محرك OCR:

  • تصويب الصور المائلة قليلاً.
  • يصحح يدويًا دوران الصور المنحرفة بشدة.
  • قم بإزالة الأوساخ والبقع والخدوش والوهج والتدرجات غير المرغوب فيها تلقائيًا وأنواع أخرى من الضوضاء.
  • ضبط تباين الصورة تلقائيا.
  • راقية تلقائيًا أو تغيير حجم الصورة يدويًا.
  • تحويل الصور إلى أبيض وأسود أو رمادي.
  • انقلب ألوان الصورة ، وجعل المناطق الخفيفة تبدو مناطق مظلمة ومظلمة تظهر الضوء.
  • زيادة سمك الأحرف في الصورة.
  • طمس الصور صاخبة مع الحفاظ على حواف الحروف.
  • قم بتصويب الصفحة المنحرفة وتصحيح تشويه عدسة الكاميرا في صور الصفحة.

واجهات برمجة التطبيقات المحددة لمختلف أنواع المستندات

يقدم Aspose.ocr for Python عبر Java شبكات عصبية مدربة خصيصًا لاستخراج النص من أنواع معينة من الصور ذات الدقة القصوى:

  • بطاقات الهوية الممسوحة ضوئيًا أو تم تصويرها.
  • لوحات ترخيص المركبات.
  • فواتير.
  • الإيصالات.

مدقق إملائي مدمج

على الرغم من أن Aspose.ocr for Python عبر Java يوفر دقة عالية التعرف ، فإن عيوب الطباعة أو الأوساخ أو الخطوط غير القياسية قد تتسبب في التعرف على شخصيات أو كلمات معينة بشكل غير صحيح. لتحسين نتائج التعرف ، يمكنك تشغيل المدقق الإملائي ، الذي يجد ويصحح أخطاء الإملاء وتؤدي تلقائيًا بناءً على لغة التعرف المحددة.

إذا كان النص المعترف به يحتوي على مصطلحات متخصصة ، اختصارات ، وكلمات أخرى غير موجودة في قواميس الإملاء المشتركة ، يمكنك توفير قوائم الكلمات الخاصة بك.

الاعتراف بكفاءة الدفعة

تمكنك Python OCR API من تبسيط التعرف على الصور. الاستفادة من أساليب معالجة الدُفعات متعددة الاستخدامات للمعالجة الفعالة لصور متعددة في مكالمة واحدة:

  • التعرف على ملفات PDF متعددة الصفحات ، TIFF.
  • معالجة جميع الملفات داخل مجلد.
  • التعامل مع التعرف على جميع الملفات في الأرشيف.
  • التعرف على الصور من قائمة محددة.

التعلم عبر أمثلة بيثون

استكشف مجموعة متنوعة من Python Ampects المصممة لمساعدتك في فهم وظائف وقدرات حل OCR بسرعة. اكتساب نظرة ثاقبة بسرعة على إنشاء حلول مخصصة تلبي متطلبات عملك المحددة.

الميزات والقدرات

Aspose.OCR for Python via Java استكشف الميزات المتقدمة لـ ASPOSE.OCR للبيثون

Feature icon

الصورة OCR

استخراج النص من صور الهاتف الذكي بدقة مستوى المسح.

Feature icon

PDF قابل للبحث

تحويل أي فحص إلى مستند قابل للبحث بالكامل وقابل للفهرسة.

Feature icon

التعرف على عنوان URL

تعرف على صورة من عنوان URL دون تنزيلها محليًا.

Feature icon

الاعتراف بالجملة

اقرأ جميع الصور من المستندات والمجلدات والأرشيفات متعددة الصفحات.

Feature icon

أي خط وأسلوب

تحديد النص والتعرف عليه في جميع المحارف والأنماط الشائعة.

Feature icon

الاعتراف بالضبط

اضبط كل معلمة OCR للحصول على أفضل نتائج التعرف.

Feature icon

المدقق الإملائي

تحسين النتائج عن طريق تصحيح الكلمات الإملائية تلقائيًا.

Feature icon

ابحث عن نص في الصور

ابحث عن النص أو التعبير العادي داخل مجموعة من الصور.

Feature icon

قارن نصوص الصور

قارن النصوص على صورتين ، بغض النظر عن الحالة والتخطيط.

عينات رمز بيثون

اكتشف عينات رمز لدمجها بسلاسة Aspose.ocr للبيثون عبر Java في تطبيقاتك.

التثبيت دون عناء

كحزمة Python أو ملف قابل للتنزيل مع الحد الأدنى من التبعيات ، يضمن Aspose.ocr لـ Python عبر Java التوزيع السهل. قم بدمجه في مشروعك مباشرة من Python ، وأنت على استعداد للاستفادة من إمكانات التعرف على الحروف الكاملة ، وتوفير نتائج التعرف على تنسيقات مختلفة.

بعد التثبيت ، تبدأ على الفور باستخدام Aspose.ocr للبيثون عبر Java ، وإن كان ذلك مع بعض القيود. يزيل الترخيص المؤقت جميع قيود الإصدار التجريبي لمدة 30 يومًا. استخدم هذه الفترة لبدء تطوير تطبيق OCR يعمل بكامل طاقته ، مما يتيح لك اتخاذ قرار مستنير بشأن شراء Aspose.ocr لـ Python عبر Java لاحقًا.

رخصة التحميل

lic = License()
lic.set_license(self.licPath)

التعرف على الصور

التحدي الأساسي في تطبيقات OCR هو ندرة الماسحات الضوئية للمستخدمين النهائيين. تتميز واجهة برمجة التطبيقات الخاصة بنا ، المدمجة بسلاسة مع Python عبر Java ، إلى مرشحات قوية للمعالجة المدمجة معالجة الصور المدورة والمنحرفة والصاخبة. جنبا إلى جنب مع الدعم لجميع تنسيقات الصور ، فإنه يتيح التعرف الموثوق ، حتى من صور الهاتف الذكي. معظم المعالجة المسبقة وتصحيح الصور مؤتمتة ، مما يتطلب تدخلك فقط في الحالات الصعبة.

تطبيق تصحيحات الصور التلقائية - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

بيثون المحول العالمي

يقرأ واجهة برمجة التطبيقات الخاصة بنا أي صورة من الماسحات الضوئية أو الكاميرات أو الهواتف الذكية: مستندات PDF ، JPEG ، PNG ، TIFF ، GIF ، BMP. يضمن الدعم الكامل لمستندات PDF متعددة الصفحات ، TIFF ، و DJVU براعة. يمكنك أيضًا تقديم صورة من الويب عبر عنوان URL.

يتم إرجاع نتائج التعرف في تنسيقات مستندات وتبادل البيانات الشائعة: نص عادي ، PDF ، Microsoft Word ، Microsoft Excel ، JSON ، و XML.

التعرف على PDF وحفظ النتائج لتنسيقات الإخراج المختلفة - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

تحسين استخدام الموارد

يوفر OCR خوارزمية التعرف الخاصة لاستخراج المحتوى من الصور ذات النص المتناثر والخلفيات الصاخبة/الملونة. هذه الطريقة تعمل بشكل كبير على تحسين دقة التعرف الضوئي على الحروف في حالات العمل التالية:

  • اقرأ النص من صور الشارع.
  • قطاع وتحديد علامات الطرق وألواح اللافتات داخل صور الشوارع.
  • تحديد علامات الأسعار وتفسير النص المستخرج كأسعار.
  • ابحث عن المناطق المثيرة للاهتمام وتجميعها على ملصقات الأغذية ، مثل المعلومات الغذائية أو قوائم المكونات.
  • تحديد وتحليل لوحات ترخيص السيارة.
  • استخراج النص من القوائم والكتالوجات.

المنطقة المفتوحة OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

استخراج النص من صور الشارع

يوفر OCR لـ Python خوارزمية اعتراف خاصة تستخرج النص من لوحات ترخيص المركبات ، بما في ذلك الصور المظلمة والضبابية. يمكن بعد ذلك حفظ النص الناتج تلقائيًا في قاعدة البيانات أو التحقق تلقائيًا.

التعرف على رقم السيارة - بيثون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)