مكتبة بايثون التعرف الضوئي على الحروف
تحويل الصور إلى نص باستخدام Python OCR
المزيد من المعارض ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
لماذا Aspose.OCR لـ Python عبر .NET؟
انطلق في رحلة مع Aspose OCR for Python عبر .NET - واجهة برمجة تطبيقات التعرف الضوئي على الحروف (OCR) متعددة الاستخدامات وسهلة الاستخدام. قم بتضمين وظيفة التعرف الضوئي على الحروف (OCR) في تطبيقات Python الخاصة بك باستخدام أقل من 5 أسطر من التعليمات البرمجية، مما يلغي الحاجة إلى العمليات الحسابية المعقدة أو الشبكات العصبية. يوفر محرك OCR القوي لدينا سرعة ودقة لا مثيل لهما، ويدعم أكثر من 130 لغة، بما في ذلك الإنجليزية والسيريلية والعربية والفارسية والهندية والصينية واليابانية والكورية والتاميلية وغيرها الكثير. سواء كانت صورًا ممسوحة ضوئيًا أو صور هواتف ذكية أو لقطات شاشة أو ملفات PDF ممسوحة ضوئيًا، يمكنك الحصول على النتائج بتنسيقات تبادل المستندات والبيانات الشائعة. استفد من مرشحات المعالجة المسبقة للتعامل مع الصور المدورة والمنحرفة والصاخبة.
التعرف الضوئي على الحروف بكفاءة ودقة
استمتع بسرعة ودقة لا مثيل لهما في نتائج التعرف الضوئي على الحروف باستخدام تقنية Python المتقدمة.
متعدد اللغات
التعرف على النص بأكثر من 140 لغة: الإنجليزية والفرنسية والألمانية والإسبانية والروسية والصينية والهندية واليابانية والكورية والتاميلية والعربية والفارسية والمزيد.
عالمي
معالجة الصور من مصادر متنوعة دون عناء - الماسحات الضوئية والكاميرات والهواتف الذكية - باستخدام لغة Python.
اللغات الآسيوية
تحقيق التعرف الدقيق على النصوص الصينية والعربية والديفاناغارية والدرافيديونية، بالإضافة إلى النصوص متعددة اللغات.
الحفاظ على التخطيط
الحفاظ على تنسيق المصدر لتمثيل النص بدقة، والتعرف على الجداول.
عينة التعليمات البرمجية الحية
تحويل صورة إلى نص في ثلاثة أسطر فقط من كود بايثون. حاول بنفسك!
* عن طريق تحميل ملفاتك أو استخدام الخدمة فإنك توافق على ذلك شروط الاستخدام و سياسة الخصوصية.
تحويل الصورة إلى نص
اكتشف المزيد من الأمثلة ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
اختر تفضيلاتك
اختر المكتبة المناسبة لاحتياجاتك. استكشف واجهات برمجة التطبيقات المتاحة وإمكانياتها لتحديد الحل الأكثر كفاءة.
براعة
Python via .NET
التوحيد
Python via Java
أداء
Python via C++
يعمل في كل مكان
بغض النظر عن الاسم، فإن Aspose.OCR لـ Python عبر .NET لا يتطلب تثبيت .NET على النظام الأساسي الهدف. تأتي حزمة التثبيت بالفعل مع جميع المكونات المطلوبة ويمكن أن تعمل بسلاسة على أي نظام أساسي - سواء كان جهازًا محليًا أو خادم ويب أو السحابة.
تنسيقات الملفات المدعومة
Aspose.OCR for Python via .NET يمكن أن تعمل مع أي ملف يمكنك الحصول عليها من الماسح الضوئي أو الكاميرا. يمكن حفظ نتائج التعرف أو استيرادها إلى قاعدة بيانات أو تحليلها في الوقت الفعلي.
الصور
- JPEG
- PNG
- TIFF
- BMP
- GIF
دفعة التعرف الضوئي على الحروف
- Multi-page PDF
- DjVu
- ZIP
- Folder
نتائج الاعتراف
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
تثبيت
يتم تسليم Aspose.OCR لـ Python عبر .NET كحزمة Python مع الحد الأدنى من التبعيات أو ك ملف قابل للتنزيل أو [حزمة PyPI](https: //pypi.org/project/aspose-ocr-python-net/). يمكنك تثبيته بسهولة في مشروعك، وستكون جاهزًا للتعرف على النصوص بأكثر من 140 لغة وحفظ نتائج التعرف بتنسيقات مختلفة.
اطلب ترخيصًا تجريبيًا لبدء تطوير تطبيق التعرف الضوئي على الحروف (OCR) كامل الوظائف دون قيود.
التعرف الضوئي على الحروف تحت بيثون
تتكامل مكتبتنا بسهولة، مما يتيح تشغيل تطبيقات Python بسلاسة على أي نظام أساسي - سطح المكتب Windows وWindows Server وmacOS وLinux والسحابة.
140+ لغات التعرف
تعد مكتبة Java OCR الخاصة بنا حلاً عالميًا لمعالجة المستندات واستخراج البيانات ورقمنة المحتوى على نطاق عالمي. ومع دعمه لمجموعة واسعة من نصوص الكتابة الأوروبية والشرق أوسطية والآسيوية، فهو ملائم تمامًا لأي بلد أو شركة.
يتعرف Aspose OCR for Java على النص في المستندات متعددة اللغات، مثل الصينية/الإنجليزية، أو العربية/الفرنسية، أو السيريلية/الإنجليزية. اللغات التالية مدعومة:
- اللاتينية الموسعة: الإنجليزية، الإسبانية، الفرنسية، الإندونيسية، البرتغالية، الألمانية، الفيتنامية، التركية، الإيطالية، البولندية، وأكثر من 80 لغة أخرى؛
- الأبجدية السيريلية: الروسية والأوكرانية والكازاخستانية والبلغارية، بما في ذلك النصوص السيريلية/الإنجليزية المختلطة؛
- العربية، الفارسية، الأردية، بما في ذلك النصوص الممزوجة بالإنجليزية؛
- اللغات الصينية والكورية واليابانية والديفاناغارية والدرافيديونية، بما في ذلك الهندية والتاميلية والماراثية وغيرها. كما يتم دعم النصوص ذات اللغات المختلطة.
مرشحات معالجة قوية
تعتمد دقة وموثوقية التعرف البصري على الأحرف بشكل كبير على جودة الصورة الأصلية. يوفر Aspose OCR for Python عبر .NET عددًا كبيرًا من مرشحات معالجة الصور الآلية واليدوية بالكامل والتي تعمل على تحسين الصورة قبل إرسالها إلى محرك OCR:
- تدوير الصور رأسًا على عقب وتدويرها تلقائيًا.
- اكتشف الصور المقلوبة واستخرج النص باللون الأبيض على الأسود.
- قم بإزالة الأوساخ والبقع والخدوش والوهج والتدرجات غير المرغوب فيها والضوضاء الأخرى تلقائيًا.
- ضبط تباين الصورة تلقائيًا.
- ترقية الصورة تلقائيًا، أو تغيير حجمها يدويًا.
- تحويل الصور إلى أبيض وأسود أو رمادي.
- ابحث عن مناطق الصورة التي يحتمل أن تكون بها مشاكل وأرجع المعلومات المتعلقة بنوع الخلل وإحداثياته.
- زيادة سمك الأحرف في الصورة.
- طمس الصور المزعجة مع الحفاظ على حواف الحروف.
- تصويب انحناء الصفحة وإصلاح تشويه عدسة الكاميرا لصور الصفحة.
الأمثل لأنواع وثيقة محددة
يوفر Aspose OCR لـ Python عبر .NET شبكات عصبية مدربة خصيصًا لاستخراج النص من أنواع معينة من الصور بأقصى قدر من الدقة:
المدقق الإملائي المدمج
على الرغم من أن مكتبة Python OCR الخاصة بنا توفر دقة عالية في التعرف، إلا أن عيوب الطباعة أو الأوساخ أو الخطوط غير القياسية قد تتسبب في التعرف على أحرف أو كلمات معينة بشكل غير صحيح. لتحسين نتائج التعرف بشكل أكبر، يمكنك تشغيل المدقق الإملائي، الذي يبحث عن الأخطاء الإملائية ويصححها تلقائيًا بناءً على لغة التعرف المحددة.
إذا كان النص الذي تم التعرف عليه يحتوي على مصطلحات متخصصة واختصارات وكلمات أخرى غير موجودة في قواميس التدقيق الإملائي الشائعة، فيمكنك توفير قوائم الكلمات الخاصة بك.
التعرف على الدفعة
تحررك واجهة برمجة تطبيقات Python OCR الخاصة بنا من التعرف على الصور واحدة تلو الأخرى. استخدم طرق معالجة الدفعات المختلفة للتعرف على صور متعددة في مكالمة واحدة:
- التعرف على ملفات PDF وTIFF وDjVu متعددة الصفحات.
- التعرف على جميع الملفات الموجودة في المجلد.
- التعرف على جميع الملفات في الأرشيف.
- التعرف على جميع الملفات من القائمة.
التعلم عن طريق العينة
يوفر التعرف الضوئي على الحروف لـ Python مجموعة من الأمثلة المكتوبة بلغة Python، مما يسمح لك بالتعرف بسرعة على وظائفها وإمكانياتها. احصل على رؤى لإنشاء حلول مخصصة لتلبية احتياجات أعمال Python الخاصة بك.
الميزات والقدرات
Aspose.OCR for Python via .NET يحل المهام الخاصة بك بسرعة وسهولة.
التعرف الضوئي على الحروف للصور
استخرج النص من صور الهاتف الذكي بدقة مستوى المسح الضوئي.
PDF قابل للبحث
قم بتحويل أي مسح ضوئي إلى مستند قابل للبحث والفهرسة والتحرير بشكل كامل.
التعرف على عنوان URL
التعرف على الصورة من URL دون تنزيلها محليًا.
الاعتراف بالجملة
اقرأ جميع الصور من المستندات والمجلدات والأرشيفات متعددة الصفحات.
أي الخط والأسلوب
التعرف على النص والتعرف عليه في جميع الخطوط والأنماط الشائعة.
التعرف الدقيق
اضبط كل معلمة OCR للحصول على أفضل نتائج التعرف.
المدقق الإملائي
تحسين النتائج عن طريق تصحيح الكلمات التي بها أخطاء إملائية تلقائيًا.
البحث عن النص في الصور
ابحث عن نص أو تعبير عادي ضمن مجموعة من الصور.
مقارنة النصوص الصورة
مقارنة النصوص على صورتين، بغض النظر عن الحالة والتخطيط.
عينات كود بايثون
تعمق في نماذج التعليمات البرمجية لدمج التعرف الضوئي على الحروف (OCR) بسلاسة في تطبيقات Python الخاصة بك.
تثبيت
يتم توزيع Aspose.OCR لـ Python عبر .NET بسهولة، حيث يتم توزيعه كعجلة Python أو حزمة قائمة بذاتها قابلة للتنزيل. يعد التكامل في مشروع Python الخاص بك، مباشرة من بيئة تطوير Python المتكاملة (IDE) المفضلة لديك، عملية سلسة. ما عليك سوى تثبيته، وستكون جاهزًا للاستفادة من النطاق الكامل لإمكانيات التعرف الضوئي على الحروف، وحفظ نتائج التعرف بتنسيقات مختلفة.
بعد التثبيت، يمكنك البدء على الفور في استخدام Aspose.OCR لـ Python عبر .NET ، وإن كان مع بعض القيود. يرفع الترخيص المؤقت جميع قيود الإصدار التجريبي لمدة 30 يومًا. استغل هذه الفترة لبدء تطوير تطبيق التعرف الضوئي على الحروف (OCR) الذي يعمل بكامل طاقته، مما يسمح لك باتخاذ قرار مستنير بشأن شراء Aspose.OCR لـ Python عبر .NET في مرحلة لاحقة.
تحميل الترخيص
lic = License()
lic.set_license(self.licPath)
التعرف على النص على الصور
تعد قراءة النص من أي محتوى في Aspose OCR for Python أمرًا سهلاً مثل استدعاء طريقة التعرف العالمية.
تحويل الصورة إلى نص - بايثون
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
محول بايثون العالمي
تقرأ واجهة برمجة التطبيقات (API) لدينا أي صورة من الماسحات الضوئية أو الكاميرات أو الهواتف الذكية ببراعة: مستندات PDF، وJPEG، وPNG، وTIFF، وGIF، وصور BMP، وحتى ملفات DjVu. يضمن الدعم الكامل لمستندات PDF متعددة الصفحات وصور TIFF وDjVu تعدد الاستخدامات. يمكنك أيضًا تقديم صورة من الويب عبر عنوان URL.
يتم إرجاع نتائج التعرف بتنسيقات تبادل المستندات والبيانات الشائعة: نص عادي، وPDF، وMicrosoft Word، وMicrosoft Excel، وJSON، وXML.
التعرف على PDF وحفظ النتائج بتنسيقات الإخراج المختلفة - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
تحسين الموارد في بايثون
يتطلب التعرف البصري على الأحرف موارد. توفر واجهة برمجة التطبيقات الخاصة بنا طرقًا مرنة لتحقيق التوازن بين الثالوث الكلاسيكي للوقت والسعر والجودة:
- اختر بين التعرف الشامل والتعرف السريع.
- حدد عدد مؤشرات الترابط المخصصة للتعرف، أو اسمح للمكتبة بالتكيف تلقائيًا مع عدد نوى المعالج.
- قم بتحرير وحدة المعالجة المركزية (CPU) عن طريق تفريغ العمليات الحسابية إلى الواجهة الخلفية لـ .NET.
التعرف السريع - بايثون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
التعرف على سطر واحد
إذا تم اقتطاع صورتك بالفعل إلى سطر واحد من النص، فيمكن التعرف عليها في أسرع وضع ممكن، بدون تصحيحات تلقائية، واكتشاف بنية المحتوى، وخطوات أخرى تستهلك الموارد. يمكنه تسريع عملية التعرف الضوئي على الحروف بما يصل إلى 7 مرات أسرع من عملية التعرف العادية.
التعرف على سطر واحد من النص في الصورة - بايثون
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)