لماذا Aspose.OCR لـ Python عبر Java؟

يقوم Aspose.OCR for Python عبر Java بدمج إمكانات التعرف البصري على الأحرف (OCR) القوية بسلاسة في دفاتر الملاحظات والتطبيقات الخاصة بـ Python عبر الأنظمة الأساسية. من خلال واجهة برمجة التطبيقات البديهية وعالية السرعة، يمكنك استخراج النص بسهولة من عمليات المسح أو لقطات الشاشة أو روابط الويب أو صور الهاتف الذكي، مما يوفر نتائج جاهزة للدمج أو التحليل أو التخزين. يمكنك التعرف على الصور الممسوحة ضوئيًا وصور الهواتف الذكية ولقطات الشاشة وملفات PDF الممسوحة ضوئيًا، وحفظ النتائج بتنسيقات المستندات الشائعة. تتعامل مرشحات المعالجة المسبقة المتقدمة مع الصور المدورة والمنحرفة والصاخبة. تحسين الأداء عن طريق تفريغ المهام إلى وحدة معالجة الرسومات.

Illustration ocr

التعرف الضوئي على الحروف سريع ودقيق

احصل على نتائج التعرف الضوئي على الحروف (OCR) عالية السرعة والدقيقة باستخدام تقنية Python المتقدمة عبر Java.

دعم متعدد اللغات

يمكنك التعرف على النص بـ 28 لغة، بما في ذلك النصوص اللاتينية والسيريلية والصينية، مما يضمن تنوع تطبيقات Python الخاصة بك عبر Java.

دعم الصور المرنة

قم بمعالجة الصور من الماسحات الضوئية والكاميرات والهواتف الذكية بسلاسة باستخدام Python عبر Java.

الدقة في التعرف على الحروف الصينية

تعرّف على أكثر من 6000 حرف صيني بدقة في مشاريع Python الخاصة بك عبر Java.

الحفاظ على أنماط الخطوط والتنسيقات

حافظ على أنماط الخطوط وتنسيقاتها لتمثيل دقيق للنص الذي تم التعرف عليه في تطبيقات Python الخاصة بك عبر Java.

عينة التعليمات البرمجية الحية

ابدأ التعرف على النص من الصور في ثلاثة أسطر فقط من التعليمات البرمجية. تجربة البساطة!

على استعداد للاعتراف على استعداد للاعتراف قم بإسقاط ملف هنا أو انقر للتصفح *

* عن طريق تحميل ملفاتك أو استخدام الخدمة فإنك توافق على ذلك شروط الاستخدام و سياسة الخصوصية.

نتيجة الاعتراف
 

تحويل الصورة إلى نص

مزيد من الأمثلة >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

التوافق مع الواجهة الخلفية لجافا

تم تصميم مكتبتنا كوحدة Python، وتضمن التوافق عبر أنظمة التشغيل الرئيسية التي تدعم Java - بما في ذلك Microsoft Windows، وLinux، وmacOS، أو المنصات السحابية. يمكّنك هذا من تطوير التطبيقات على أحد الأنظمة الأساسية وتشغيلها بسلاسة على نظام آخر، مما يلغي الحاجة إلى أي تعديلات على التعليمات البرمجية.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

تنسيقات الملفات المدعومة

Aspose.OCR for Python via Java يمكن أن تعمل مع أي [ملف]تقريبا( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) يمكنك الحصول عليها من الماسح الضوئي أو الكاميرا. يتم إرجاع نتائج التعرف بتنسيقات تبادل الملفات والبيانات الأكثر شيوعًا والتي يمكن حفظها أو استيرادها إلى قاعدة بيانات أو تحليلها في الوقت الفعلي.

الصور

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

دفعة التعرف الضوئي على الحروف

  • Multi-page PDF
  • ZIP
  • Folder

نتائج الاعتراف

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

التثبيت السهل لبيثون عبر جافا

يتم تسليم Aspose.OCR لـ Python عبر Java كحزمة Python أو ملف قابل للتنزيل مع الحد الأدنى من التبعيات. يمكنك تثبيت بسهولة في مشروعك، وستكون جاهزًا للتعرف على النصوص بلغات متعددة مدعومة وحفظ نتائج التعرف بتنسيقات مختلفة.

اطلب ترخيصًا تجريبيًا لبدء تطوير تطبيق التعرف الضوئي على الحروف (OCR) كامل الوظائف دون قيود.

التعرف الضوئي على الحروف (OCR) القوي لتطبيقات بايثون

تتكامل مكتبتنا بسهولة، مما يتيح تشغيل تطبيقات Python بسلاسة على أي نظام أساسي - سطح المكتب Windows وWindows Server وmacOS وLinux والسحابة.

28 لغة الاعتراف

تتعرف واجهة برمجة تطبيقات Python وJava OCR على عدد كبير من اللغات ونصوص الكتابة الشائعة، بما في ذلك اللغات المختلطة:

اترك اكتشاف اللغة للمكتبة أو قم بتعريف اللغة بنفسك لتحسين أداء التعرف والموثوقية.

  • الأبجدية اللاتينية الموسعة: الكرواتية، التشيكية، الدانمركية، الهولندية، الإنجليزية، الإستونية، الفنلندية، الفرنسية، الألمانية، الإيطالية، اللاتفية، الليتوانية، النرويجية، البولندية، البرتغالية، الرومانية، السلوفاكية، السلوفينية، الإسبانية، السويدية؛
  • الأبجدية السيريلية: البيلاروسية، البلغارية، الكازاخستانية، الروسية، الصربية، الأوكرانية؛
  • الصينية: أكثر من 6000 حرف؛
  • الهندية.

مرشحات معالجة الصور المحسنة

تعتمد دقة التعرف البصري على الأحرف بشكل كبير على جودة الصورة الأصلية. يوفر Aspose.OCR for Python via Java مجموعة واسعة من مرشحات معالجة الصور الآلية واليدوية لتحسين الصورة قبل إرسالها إلى محرك OCR:

  • قم بتسوية الصور المائلة قليلاً تلقائيًا.
  • قم بتصحيح دوران الصور شديدة الانحراف يدويًا.
  • قم بإزالة الأوساخ والبقع والخدوش والوهج والتدرجات غير المرغوب فيها وأنواع الضوضاء الأخرى تلقائيًا.
  • ضبط تباين الصورة تلقائيًا.
  • ترقية الصورة تلقائيًا أو تغيير حجمها يدويًا.
  • تحويل الصور إلى أبيض وأسود أو رمادي.
  • عكس ألوان الصورة، مما يجعل المناطق الفاتحة تظهر داكنة والمناطق الداكنة تظهر فاتحة.
  • زيادة سمك الأحرف في الصورة.
  • طمس الصور المزعجة مع الحفاظ على حواف الحروف.
  • تسوية انحراف الصفحة وتصحيح تشوه عدسة الكاميرا في صور الصفحة.

واجهات برمجة التطبيقات المحددة لأنواع المستندات المختلفة

يوفر Aspose.OCR for Python via Java شبكات عصبية مدربة خصيصًا لاستخراج النص من أنواع معينة من الصور بأقصى قدر من الدقة:

  • بطاقات الهوية وجوازات السفر الممسوحة ضوئيًا أو المصورة.
  • لوحات ترخيص المركبات.
  • الفواتير.
  • الإيصالات.

المدقق الإملائي المدمج

على الرغم من أن Aspose.OCR for Python عبر Java يوفر دقة عالية في التعرف، إلا أن عيوب الطباعة أو الأوساخ أو الخطوط غير القياسية قد تتسبب في التعرف على أحرف أو كلمات معينة بشكل غير صحيح. لتحسين نتائج التعرف بشكل أكبر، يمكنك تشغيل المدقق الإملائي، الذي يبحث عن الأخطاء الإملائية ويصححها تلقائيًا بناءً على لغة التعرف المحددة.

إذا كان النص الذي تم التعرف عليه يحتوي على مصطلحات متخصصة واختصارات وكلمات أخرى غير موجودة في قواميس التدقيق الإملائي الشائعة، فيمكنك توفير قوائم الكلمات الخاصة بك.

التعرف على الدفعة بكفاءة

تمكّنك واجهة برمجة تطبيقات Python OCR الخاصة بنا من تسهيل عملية التعرف على الصور. استخدم طرق معالجة الدفعات المتنوعة للمعالجة الفعالة لصور متعددة في مكالمة واحدة:

  • التعرف على ملفات PDF وTIFF متعددة الصفحات.
  • معالجة كافة الملفات داخل مجلد.
  • التعامل مع التعرف على جميع الملفات في الأرشيف.
  • التعرف على الصور من قائمة محددة.

التعلم عبر أمثلة بايثون

استكشف مجموعة متنوعة من أمثلة Python المصممة لمساعدتك على فهم وظائف وإمكانيات حل التعرف الضوئي على الحروف الخاص بنا بسرعة. احصل بسرعة على نظرة ثاقبة لإنشاء حلول مخصصة تلبي متطلبات عملك المحددة.

الميزات والقدرات

Aspose.OCR for Python via Java اكتشف الميزات المتقدمة لـ Aspose.OCR لـ Python

Feature icon

التعرف الضوئي على الحروف للصور

استخرج النص من صور الهاتف الذكي بدقة مستوى المسح الضوئي.

Feature icon

ملف PDF قابل للبحث

قم بتحويل أي مسح ضوئي إلى مستند قابل للبحث والفهرسة بشكل كامل.

Feature icon

التعرف على عنوان URL

التعرف على الصورة من URL دون تنزيلها محليًا.

Feature icon

الاعتراف بالجملة

اقرأ جميع الصور من المستندات والمجلدات والأرشيفات متعددة الصفحات.

Feature icon

أي الخط والأسلوب

التعرف على النص والتعرف عليه في جميع الخطوط والأنماط الشائعة.

Feature icon

التعرف الدقيق

اضبط كل معلمة OCR للحصول على أفضل نتائج التعرف.

Feature icon

مدقق املائي

تحسين النتائج عن طريق تصحيح الكلمات التي بها أخطاء إملائية تلقائيًا.

Feature icon

البحث عن النص في الصور

ابحث عن نص أو تعبير عادي ضمن مجموعة من الصور.

Feature icon

مقارنة النصوص الصورة

مقارنة النصوص على صورتين، بغض النظر عن الحالة والتخطيط.

عينات كود بايثون

اكتشف نماذج التعليمات البرمجية لدمج Aspose.OCR لـ Python عبر Java في تطبيقاتك بسلاسة.

تركيب سهل

كحزمة Python أو ملف قابل للتنزيل مع الحد الأدنى من التبعيات، يضمن Aspose.OCR لـ Python عبر Java سهولة التوزيع. قم بدمجه في مشروعك مباشرةً من Python، وستكون جاهزًا للاستفادة من إمكانات التعرف الضوئي على الحروف الكاملة، وحفظ نتائج التعرف بتنسيقات مختلفة.

بعد التثبيت، ابدأ على الفور في استخدام Aspose.OCR لـ Python عبر Java، وإن كان مع بعض القيود. يزيل الترخيص المؤقت جميع قيود الإصدار التجريبي لمدة 30 يومًا. استغل هذه الفترة لبدء تطوير تطبيق التعرف الضوئي على الحروف (OCR) كامل الوظائف، مما يسمح لك باتخاذ قرار مستنير بشأن شراء Aspose.OCR لـ Python عبر Java لاحقًا.

تحميل الترخيص

lic = License()
lic.set_license(self.licPath)

التعرف على الصور

التحدي الرئيسي في تطبيقات التعرف الضوئي على الحروف هو ندرة الماسحات الضوئية للمستخدمين النهائيين. تتميز واجهة برمجة التطبيقات (API) الخاصة بنا، والتي تم دمجها بسلاسة مع Python عبر Java، بمرشحات قوية للمعالجة المسبقة للصور تتعامل مع الصور المدورة والمنحرفة والمزعجة. ومع دعم جميع تنسيقات الصور، فإنه يسمح بالتعرف الموثوق به، حتى من صور الهاتف الذكي. تتم معظم عمليات المعالجة المسبقة وتصحيح الصور تلقائيًا، مما يتطلب تدخلك فقط في الحالات الصعبة.

تطبيق التصحيحات التلقائية للصور - بايثون

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

محول بايثون العالمي

تقرأ واجهة برمجة التطبيقات (API) الخاصة بنا أي صورة من الماسحات الضوئية أو الكاميرات أو الهواتف الذكية ببراعة: مستندات PDF وملفات JPEG وPNG وTIFF وGIF وBMP. يضمن الدعم الكامل لمستندات PDF متعددة الصفحات وصور TIFF وDjVu تعدد الاستخدامات. يمكنك أيضًا تقديم صورة من الويب عبر عنوان URL.

يتم إرجاع نتائج التعرف بتنسيقات تبادل المستندات والبيانات الشائعة: نص عادي، وPDF، وMicrosoft Word، وMicrosoft Excel، وJSON، وXML.

التعرف على PDF وحفظ النتائج بتنسيقات الإخراج المختلفة - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

تحسين استخدام الموارد

يوفر التعرف الضوئي على الحروف (OCR) خوارزمية تعرف خاصة لاستخراج المحتوى من الصور ذات النصوص المتناثرة والخلفيات الصاخبة/الملونة. تعمل هذه الطريقة على تحسين دقة التعرف الضوئي على الحروف بشكل كبير في حالات العمل التالية:

  • قراءة النص من صور الشوارع.
  • تقسيم وتحديد علامات الطريق واللافتات ضمن صور الشوارع.
  • تحديد علامات الأسعار وتفسير النص المستخرج على أنه أسعار.
  • ابحث عن المناطق محل الاهتمام وقم بتجميعها على ملصقات الأطعمة، مثل المعلومات الغذائية أو قوائم المكونات.
  • تحديد وتحليل لوحات ترخيص السيارة.
  • استخراج النص من القوائم والكتالوجات.

منطقة مفتوحة التعرف الضوئي على الحروف - بايثون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

استخراج النص من صور الشوارع

يوفر التعرف الضوئي على الحروف (OCR) لـ Python خوارزمية تعرف خاصة تستخرج النص من لوحات ترخيص المركبات، بما في ذلك الصور المظلمة والضبابية. يمكن بعد ذلك حفظ النص الناتج تلقائيًا في قاعدة البيانات أو التحقق منه تلقائيًا.

التعرف على رقم السيارة - بايثون

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)