Aspose.OCR  for C++

Μετατρέψτε εικόνες και PDF σε κείμενο σε C++

Προσθέστε οπτική αναγνώριση χαρακτήρων (OCR) στις εφαρμογές σας C++ με μερικές γραμμές κώδικα.

  Download Free Trial
  
 

Το Aspose.OCR για C++ επεκτείνει τις εφαρμογές σας με δυνατότητες οπτικής αναγνώρισης χαρακτήρων σε 5 γραμμές κώδικα. Η εμπειρία μας στα νευρωνικά δίκτυα και τη μηχανική εκμάθηση έχει μεταφραστεί σε μια βιβλιοθήκη OCR με ανώτερη απόδοση και ακρίβεια που υποστηρίζει 26 γλώσσες που βασίζονται σε λατινικά και κυριλλικά σενάρια καθώς και στα κινέζικα . Το OCR API μπορεί να αναγνωρίσει σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης, περιοχές εικόνων και σαρωμένα PDF και να επιστρέψει αποτελέσματα στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Είναι εντελώς εκτός σύνδεσης και δεν απαιτεί σύνδεση στο διαδίκτυο για να λειτουργήσει. Το API απαιτεί ελάχιστη προσπάθεια για να ξεκινήσετε και μια ρηχή καμπύλη εκμάθησης για να κυριαρχήσετε. Όλες οι εργασίες προεπεξεργασίας, διόρθωσης κλίσης, αφαίρεσης θορύβου, ανίχνευσης γλώσσας, πολλαπλών νημάτων και άλλων σύνθετων εργασιών εκτελούνται αυτόματα, αλλά μπορούν να ρυθμιστούν για την αντιμετώπιση δύσκολων υποθέσεων.

Προηγμένες δυνατότητες C++ OCR API

Εξάγει κείμενο από εικόνες και δημιουργεί PDF με δυνατότητα αναζήτησης

Υποστηρίζει οποιαδήποτε εικόνα μπορείτε να λάβετε από σαρωτή ή κάμερα

Διαβάζει εκτεταμένες λατινικές και κυριλλικές γραφές

Αναγνωρίζει πάνω από 6.000 κινεζικούς χαρακτήρες

Εντοπίζει και αναγνωρίζει όλες τις δημοφιλείς γραμματοσειρές και μορφοποίηση

Προεπεξεργάζεται τις εικόνες πριν από την αναγνώριση

Επεξεργάζεται μόνο ολόκληρη την εικόνα ή επιλεγμένες περιοχές

Υποστηρίζει περιστρεφόμενες, λοξές και θορυβώδεις εικόνες

Μαζική αναγνώριση όλων των εικόνων σε φάκελο ή αρχείο

Αναγνωρίζει τις εικόνες που παρέχονται ως συνδέσμους Ιστού

Βρίσκει και διορθώνει αυτόματα τις ανορθόγραφες λέξεις

Λάβετε αποτέλεσμα αναγνώρισης ως JSON

Εύχρηστος

Εξακολουθείτε να πιστεύετε ότι το C++ OCR είναι δύσκολο; Με τη βιβλιοθήκη μας, χρειάζεστε μόνο 5 γραμμές κώδικα για να αναγνωρίσετε την εικόνα και να εμφανίσετε το αποτέλεσμα. Δοκιμάστε αυτόν τον κωδικό και δείτε μόνοι σας:

Εικόνα σε κείμενο σε 5 γραμμές - C++

// Παρέχετε διαδρομή εικόνας
std::string image_path = "../Data/Source/sample.png";

// Προετοιμάστε buffer για το αποτέλεσμα
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Κάνε τα μαγικά
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Εμφάνιση του αποτελέσματος αναγνώρισης
std::wcout << buffer << L"\n";

26 Γλώσσες αναγνώρισης

Το OCR API μπορεί να αναγνωρίσει μεγάλο αριθμό γλωσσών και όλα τα δημοφιλή σενάρια γραφής, συμπεριλαμβανομένων κειμένων με μεικτές γλώσσες.

  • Εκτεταμένο λατινικό αλφάβητο : Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
  • Κυριλλικό αλφάβητο : Λευκορωσικό, Βουλγαρικό, Καζακστάν, Ρωσικό, Σερβικό, Ουκρανικό.
  • Κινέζικα : περισσότεροι από 6.000 χαρακτήρες.

Μπορείτε να αφήσετε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή να ορίσετε τη γλώσσα μόνοι σας για να αυξήσετε την απόδοση και την αξιοπιστία της αναγνώρισης.

Επεξεργασία παρτίδων

Το OCR API σάς απαλλάσσει από την αναγνώριση κάθε εικόνας μία προς μία, προσφέροντας διάφορες μεθόδους επεξεργασίας παρτίδας που σας επιτρέπουν να αναγνωρίζετε πολλές εικόνες σε μία κλήση:

  • Αναγνώριση πολυσέλιδων αρχείων PDF και TIFF.
  • Αναγνώριση όλων των αρχείων σε ένα φάκελο.
  • Αναγνώριση όλων των αρχείων σε ένα αρχείο.

Αναγνώριση αρχείου ZIP - C++

// Παρέχετε τη διαδρομή αρχειοθέτησης
std::string archive_path = "book.zip";

// Προετοιμάστε buffer για το αποτέλεσμα
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Αρχικοποίηση αντικειμένου RecognitionSettings με προεπιλεγμένες τιμές
RecognitionSettings settings;

// Αναγνωρίζω
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Διατήρηση μορφοποίησης

Η βιβλιοθήκη OCR διαβάζει όλες τις δημοφιλείς γραμματοσειρές όπως Arial, Times New Roman, Courier New, Tahoma, Calibri και άλλα σε κανονικά, έντονα και πλάγια στυλ και διατηρεί προσεκτικά τη μορφοποίηση στα αποτελέσματα OCR. Μπορείτε επίσης να χωρίσετε τα αποτελέσματα αναγνώρισης σε γραμμές και να εντοπίσετε περιοχές κειμένου σε μια σελίδα.

Αναγνώριση φωτογραφιών

Η ευρεία υιοθέτηση των εφαρμογών OCR συνήθως διακόπτεται από το γεγονός ότι οι σαρωτές δεν είναι συνηθισμένοι για τους περισσότερους χρήστες. Η βιβλιοθήκη μας OCR διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνων που μπορούν να χειριστούν σκοτεινές, περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Σε συνδυασμό με την υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει την αξιόπιστη αναγνώριση ακόμη και φωτογραφιών smartphone. Το μεγαλύτερο μέρος της προεπεξεργασίας και της διόρθωσης εικόνας γίνεται αυτόματα, οπότε θα χρειαστεί να επέμβετε μόνο σε δύσκολες περιπτώσεις.

Ορίστε προσαρμοσμένη γωνία για διόρθωση λοξής - C++

// Πρωτότυπη εικόνα
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Προετοιμάστε buffer για το αποτέλεσμα
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Ρυθμίστε τη γωνία κλίσης
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Αναγνώριση εικόνας
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Ορθογραφικός έλεγχος

Ενώ το OCR παράγει αξιόπιστα αποτελέσματα, η σκόνη και τα ελαττώματα εκτύπωσης ενδέχεται να προκαλέσουν λανθασμένη αναγνώριση ορισμένων συμβόλων. Το OCR API διαθέτει έναν ενσωματωμένο ορθογραφικό έλεγχο που αντικαθιστά αυτόματα τις ανορθόγραφες λέξεις και σας απαλλάσσει από τη μη αυτόματη διόρθωση των αποτελεσμάτων αναγνώρισης.

  
  

Το Aspose προσφέρει επίσης εγγενή API OCR για άλλες δημοφιλείς γλώσσες προγραμματισμού: