Optical character recognition API for Python

Εξαγωγή κειμένου από σαρωμένες εικόνες, φωτογραφίες και στιγμιότυπα οθόνης, δημιουργία PDF με δυνατότητα αναζήτησης, αναζήτηση και σύγκριση κειμένου σε εικόνες και πολλά άλλα από εφαρμογές Python.

Aspose.OCR for Python via .NET είναι μια ισχυρή, αλλά εύχρηστη μηχανή οπτικής αναγνώρισης χαρακτήρων (OCR) για τις εφαρμογές Python και τα notebook σας. Σε λιγότερες από 10 γραμμές κώδικα, μπορείτε να αναγνωρίσετε κείμενο σε 28 γλώσσες με βάση λατινικά, κυριλλικά και ασιατικά σενάρια, επιστρέφοντας αποτελέσματα στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Δεν χρειάζεται να μάθετε πολύπλοκα μαθηματικά μοντέλα, να δημιουργήσετε αλγόριθμους μηχανικής μάθησης και να εκπαιδεύσετε νευρωνικά δίκτυα — Το απλό και ισχυρό API μας θα κάνει τα πάντα για εσάς.

Η βιβλιοθήκη λειτουργεί εξίσου καλά με όλες τις πηγές, από σάρωση υψηλής ποιότητας έως γρήγορη φωτογραφία σε smartphone. Είτε η εικόνα είναι περιστρεφόμενη, παραμορφωμένη ή θορυβώδης — Τα αυτόματα φίλτρα πριν και μετά την επεξεργασία παρέχουν την υψηλότερη ακρίβεια αναγνώρισης στο συντομότερο χρόνο.

Με μια ματιά

Εξαγωγή κειμένου σε μεγάλες ευρωπαϊκές και ασιατικές γλώσσες από οποιονδήποτε τύπο εικόνας

Τύποι εικόνων

Φωτογραφίες
Βιβλία
Άρθρα
Συμβάσεις
Δελτία ταυτότητας
Διαβατήρια
Αποδείξεις
Τιμολόγια
Πινακίδες κυκλοφορίας
και άλλα...

Υποστηριζόμενες γλώσσες

Αγγλικά
Κινεζικά
Χίντι
Γερμανικά
Γαλλικά
Ισπανικά
Ρωσικά
Ιταλικά
Πολωνικά
και άλλα...

Aspose.OCR

Πλατφόρμα Ανεξαρτησίας

Aspose.OCR for Python via .NET λειτουργεί με Python έκδοση 3.6 ή νεότερη

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

Υποστηριζόμενες μορφές αρχείων

Μετατρέψτε οποιαδήποτε εικόνα από σαρωτή, κάμερα ή Διαδίκτυο στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων

Αρχεία πηγής

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

Αποτελέσματα αναγνώρισης

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

Χαρακτηριστικά και δυνατότητες

Εξαγωγή κειμένου από σαρώσεις, φωτογραφίες και στιγμιότυπα οθόνης

Μετατρέψτε το σαρωμένο PDF σε PDF με δυνατότητα αναζήτησης και ευρετηρίασης

Διαβάστε λατινική, κυριλλική και ασιατική γραφή σε όλες τις δημοφιλείς γραμματοσειρές

Αναγνωρίστε περισσότερους από 6.000 κινεζικούς χαρακτήρες

Εργαστείτε με θολές, παραμορφωμένες, περιστρεφόμενες και θορυβώδεις εικόνες

Προσδιορίστε και διατηρήστε μπλοκ περιεχομένου από την αρχική διάταξη κειμένου

Εντοπίστε και διαβάστε περιοχές μιας εικόνας: παραγράφους, γραμμές και μεμονωμένες λέξεις

Μαζική επεξεργασία πολυσέλιδων εγγράφων, φακέλων και αρχείων

Αναγνώριση εικόνων από το Διαδίκτυο χωρίς λήψη

Προσδιορίστε και διορθώστε αυτόματα τις ανορθόγραφες λέξεις

Βρείτε κείμενο σε εικόνες και συγκρίνετε έξυπνα κείμενα εικόνων

Εύχρηστος

Χρειάζεστε μόνο 5 γραμμές κώδικα για να αναγνωρίσετε την εικόνα και να εμφανίσετε το αποτέλεσμα. Ναι, είναι πραγματικά τόσο απλό!

Έτοιμος να αναγνωρίσει Αναγνωρίζοντας Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για περιήγηση *

* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Όροι χρήσης και Πολιτική Απορρήτου.

Ζωντανό δείγμα κώδικα - Python 3

# Εκκινήστε τον κινητήρα OCR
recognitionEngine = AsposeOcr()
# Προσθήκη εικόνας σε παρτίδα
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Εξαγωγή κειμένου από την εικόνα
result = recognitionEngine.recognize(input)
# Εμφάνιση του αποτελέσματος αναγνώρισης
print(result[0].recognition_text)

Recognition result

28 γλώσσες αναγνώρισης

To Aspose.OCR for Python via .NET μπορεί να αναγνωρίσει μεγάλο αριθμό γλωσσών και όλα τα δημοφιλή σενάρια γραφής, συμπεριλαμβανομένων κειμένων με μικτές γλώσσες:

Εκτεταμένο λατινικό αλφάβητο: Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά (συμπεριλαμβανομένης της χειρόγραφης γραφής), Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά , Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
Κυριλλικό αλφάβητο: Λευκορωσικά, Βουλγαρικά, Καζακικά, Ρώσικα, Σερβικά, Ουκρανικά.
Κινεζικά: περισσότεροι από 6.000 χαρακτήρες.
Χίντι

Μπορείτε επίσης να διαβάσετε κείμενα σε άλλες γλώσσες που βασίζονται σε εκτεταμένα λατινικά και κυριλλικά, ακόμα κι αν δεν υποστηρίζονται άμεσα από τη μηχανή OCR. Για παράδειγμα, λατινικά, βιετναμέζικα, γαελικά και ούτω καθεξής.

Ισχυρά φίλτρα επεξεργασίας

Η ακρίβεια και η αξιοπιστία της οπτικής αναγνώρισης χαρακτήρων εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής εικόνας. Το Aspose.OCR for Python via .NET προσφέρει έναν μεγάλο αριθμό πλήρως αυτοματοποιημένων και μη αυτόματων φίλτρων επεξεργασίας εικόνας που βελτιώνουν μια εικόνα πριν σταλεί στη μηχανή OCR:

Αυτόματη ευθυγράμμιση εικόνων που είναι ευθυγραμμισμένες σε μια μικρή γωνία προς την οριζόντια.
Χειροκίνητη περιστροφή εικόνων με έντονη λοξή.
Αφαιρέστε αυτόματα τη βρωμιά, τα σημεία, τις γρατσουνιές, τη λάμψη, τις ανεπιθύμητες κλίσεις και άλλους θορύβους.
Προσαρμόστε αυτόματα την αντίθεση της εικόνας.
Αυτόματη αναβάθμιση ή μη αυτόματη αλλαγή μεγέθους της εικόνας.
Μετατροπή εικόνων σε ασπρόμαυρες ή σε κλίμακα του γκρι.
Αντιστρέψτε τα χρώματα της εικόνας έτσι ώστε οι φωτεινές περιοχές να εμφανίζονται σκοτεινές και οι σκοτεινές περιοχές να εμφανίζονται ανοιχτές.
Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
Θολώστε τις θορυβώδεις εικόνες διατηρώντας τις άκρες των γραμμάτων.
Ισιώστε την καμπυλότητα της σελίδας και διορθώστε την παραμόρφωση του φακού της κάμερας για φωτογραφίες σελίδας.

Αυτά τα φίλτρα μπορούν να συνδυαστούν και να εφαρμοστούν σε ολόκληρη την εικόνα ή μόνο σε επιλεγμένες περιοχές της εικόνας, καθώς και σε ομαδική επεξεργασία. Όχι μόνο μπορείτε να βελτιστοποιήσετε την προεπεξεργασία στη γραμμή αναγνώρισης, αλλά μπορείτε επίσης να αποθηκεύσετε επεξεργασμένες εικόνες για εμφάνιση, αποθήκευση στην προσωρινή μνήμη και εντοπισμό σφαλμάτων.

Βελτιστοποιημένο για συγκεκριμένους τύπους εγγράφων

Aspose.OCR for Python via .NET προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:

Σαρωμένα ή φωτογραφημένα δελτία ταυτότητας και διαβατήρια.
Πινακίδες κυκλοφορίας οχημάτων.
Τιμολόγια.
Αποδείξεις.

Ενσωματωμένος ορθογραφικός έλεγχος

Αν και το Aspose.OCR for Python via .NET παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυπικές γραμματοσειρές ενδέχεται να προκαλέσουν εσφαλμένη αναγνώριση ορισμένων χαρακτήρων ή λέξεων. Για περαιτέρω βελτίωση των αποτελεσμάτων αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος εντοπίζει και διορθώνει αυτόματα τα ορθογραφικά λάθη με βάση την επιλεγμένη γλώσσα αναγνώρισης.

Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντομογραφίες και άλλες λέξεις που δεν υπάρχουν σε κοινά ορθογραφικά λεξικά, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.

Δημιουργία PDF με δυνατότητα αναζήτησης

Ακόμη και με την υψηλότερη ακρίβεια αναγνώρισης, η αρχική εικόνα μπορεί να περιέχει πολλές σημαντικές μη κειμενικές πληροφορίες ή απλώς να έχει μεγάλη ιστορική αξία. Το Aspose.OCR for Python via .NET προσφέρει μια απλή και κομψή λύση για να συνδυάσετε τα καλύτερα και των δύο κόσμων. Εξάγουμε κείμενο από μια εικόνα, ένα έγγραφο PDF ή ένα πακέτο αρχείου και το τοποθετούμε ως αόρατο στρώμα κειμένου πάνω από τις αρχικές εικόνες. Το αποτέλεσμα αποθηκεύεται σε μορφή PDF, που είναι το βιομηχανικό πρότυπο για την αποθήκευση και την κοινή χρήση εγγράφων. Τα αρχεία που προκύπτουν μπορούν να αναζητηθούν και να ευρετηριαστούν και το κείμενο μπορεί να επιλεγεί και να αντιγραφεί με τον ίδιο τρόπο όπως εάν επιλέξατε και αντιγράψατε τους αρχικούς χαρακτήρες.

Μαζική αναγνώριση

Aspose.OCR for Python via .NET σας επιτρέπει να αναγνωρίζετε πολλά αρχεία, ανεξάρτητα από τον αριθμό και τον τύπο τους, τόσο απλά όσο η ανάγνωση μιας μεμονωμένης εικόνας. Με μία κλήση API, μπορείτε να αναγνωρίσετε πολλές σελίδες από έναν σαρωτή αυτόματης τροφοδοσίας ή να εξαγάγετε πινακίδες κυκλοφορίας οχημάτων από αυτόματες κάμερες κυκλοφορίας.

Τα αποτελέσματα μπορούν να αποθηκευτούν ως έγγραφο PDF με δυνατότητα αναζήτησης ή υπολογιστικά φύλλα ή να επιστραφούν ως απλό κείμενο, JSON ή XML για περαιτέρω ανάλυση.

Support and Learning Resources

Γιατί Aspose.OCR for Python via .NET;
Λίστα Πελατών
Ιστορίες επιτυχίας

Download Free Trial Pricing Information

Το Aspose προσφέρει επίσης εγγενή API OCR για άλλες δημοφιλείς γλώσσες προγραμματισμού:

Optical character recognition API for Python

Aspose.OCR for Python via .NET

Overview

Με μια ματιά

Πλατφόρμα Ανεξαρτησίας

Υποστηριζόμενες μορφές αρχείων

Χαρακτηριστικά και δυνατότητες

Εύχρηστος

Ζωντανό δείγμα κώδικα - Python 3

28 γλώσσες αναγνώρισης

Ισχυρά φίλτρα επεξεργασίας

Βελτιστοποιημένο για συγκεκριμένους τύπους εγγράφων

Ενσωματωμένος ορθογραφικός έλεγχος

Δημιουργία PDF με δυνατότητα αναζήτησης

Μαζική αναγνώριση

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET