Μετατρέψτε εικόνες και PDF σε κείμενο σε C++

Προσθέστε οπτική αναγνώριση χαρακτήρων (OCR) στις εφαρμογές σας C++ με μερικές γραμμές κώδικα.

Το Aspose.OCR για C++ επεκτείνει τις εφαρμογές σας με δυνατότητες οπτικής αναγνώρισης χαρακτήρων σε 5 γραμμές κώδικα. Η εμπειρία μας στα νευρωνικά δίκτυα και τη μηχανική εκμάθηση έχει μεταφραστεί σε μια βιβλιοθήκη OCR με ανώτερη απόδοση και ακρίβεια που υποστηρίζει 26 γλώσσες που βασίζονται σε λατινικά και κυριλλικά σενάρια καθώς και στα κινέζικα . Το OCR API μπορεί να αναγνωρίσει σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης, περιοχές εικόνων και σαρωμένα PDF και να επιστρέψει αποτελέσματα στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Είναι εντελώς εκτός σύνδεσης και δεν απαιτεί σύνδεση στο διαδίκτυο για να λειτουργήσει. Το API απαιτεί ελάχιστη προσπάθεια για να ξεκινήσετε και μια ρηχή καμπύλη εκμάθησης για να κυριαρχήσετε. Όλες οι εργασίες προεπεξεργασίας, διόρθωσης κλίσης, αφαίρεσης θορύβου, ανίχνευσης γλώσσας, πολλαπλών νημάτων και άλλων σύνθετων εργασιών εκτελούνται αυτόματα, αλλά μπορούν να ρυθμιστούν για την αντιμετώπιση δύσκολων υποθέσεων.

Με μια ματιά

Μια σύντομη περίληψη των δυνατοτήτων οπτικής αναγνώρισης χαρακτήρων.

Βασικά Χαρακτηριστικά

Εξαγωγή κειμένου από φωτογραφίες
Δημιουργήστε αρχεία PDF με δυνατότητα αναζήτησης
Αυτόματες διορθώσεις εικόνας
Υποστήριξη πολλαπλών γραμματοσειρών
Διατήρηση μορφοποίησης κειμένου
Ανίχνευση θραυσμάτων κειμένου
Επεξεργασία παρτίδας
Ορθογραφικός έλεγχος

Υποστηριζόμενες γλώσσες

αγγλική γλώσσα
κινεζική γλώσσα
γερμανική γλώσσα
γαλλική γλώσσα
ιταλική γλώσσα
Ισπανική γλώσσα
ρωσική γλώσσα
Τσεχική γλώσσα
Πολωνική γλώσσα
Ουκρανική γλώσσα
Ολλανδική γλώσσα
Εσθονική γλώσσα
και 10+ ακόμη

Aspose.OCR

Πλατφόρμα Ανεξαρτησίας

Η βιβλιοθήκη OCR υποστηρίζει πλήρως εφαρμογές C++ τόσο για Windows όσο και για Linux.

Windows 64 bit

Linux 64 bit

Aspose.OCR

Υποστηριζόμενες μορφές αρχείων

Μετατρέψτε οποιοδήποτε αρχείο λαμβάνετε από σαρωτή ή κάμερα στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων.

Αρχεία πηγής

PDF
JPEG
PNG
TIFF
BMP

Αποτελέσματα αναγνώρισης

PDF με δυνατότητα αναζήτησης
Microsoft Word
Microsoft Excel
Απλό κείμενο
JSON
XML

Aspose.OCR

Προηγμένες δυνατότητες C++ OCR API

Εξάγει κείμενο από εικόνες και δημιουργεί PDF με δυνατότητα αναζήτησης

Υποστηρίζει οποιαδήποτε εικόνα μπορείτε να λάβετε από σαρωτή ή κάμερα

Διαβάζει εκτεταμένες λατινικές και κυριλλικές γραφές

Αναγνωρίζει πάνω από 6.000 κινεζικούς χαρακτήρες

Εντοπίζει και αναγνωρίζει όλες τις δημοφιλείς γραμματοσειρές και μορφοποίηση

Προεπεξεργάζεται τις εικόνες πριν από την αναγνώριση

Επεξεργάζεται μόνο ολόκληρη την εικόνα ή επιλεγμένες περιοχές

Υποστηρίζει περιστρεφόμενες, λοξές και θορυβώδεις εικόνες

Μαζική αναγνώριση όλων των εικόνων σε φάκελο ή αρχείο

Αναγνωρίζει τις εικόνες που παρέχονται ως συνδέσμους Ιστού

Βρίσκει και διορθώνει αυτόματα τις ανορθόγραφες λέξεις

Λάβετε αποτέλεσμα αναγνώρισης ως JSON

Εύχρηστος

Εξακολουθείτε να πιστεύετε ότι το C++ OCR είναι δύσκολο; Με τη βιβλιοθήκη μας, χρειάζεστε μόνο 5 γραμμές κώδικα για να αναγνωρίσετε την εικόνα και να εμφανίσετε το αποτέλεσμα. Δοκιμάστε αυτόν τον κωδικό και δείτε μόνοι σας:

Εικόνα σε κείμενο σε 5 γραμμές - C++

// Παρέχετε διαδρομή εικόνας
std::string image_path = "../Data/Source/sample.png";

// Προετοιμάστε buffer για το αποτέλεσμα
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Κάνε τα μαγικά
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Εμφάνιση του αποτελέσματος αναγνώρισης
std::wcout << buffer << L"\n";

26 Γλώσσες αναγνώρισης

Το OCR API μπορεί να αναγνωρίσει μεγάλο αριθμό γλωσσών και όλα τα δημοφιλή σενάρια γραφής, συμπεριλαμβανομένων κειμένων με μεικτές γλώσσες.

Εκτεταμένο λατινικό αλφάβητο : Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
Κυριλλικό αλφάβητο : Λευκορωσικό, Βουλγαρικό, Καζακστάν, Ρωσικό, Σερβικό, Ουκρανικό.
Κινέζικα : περισσότεροι από 6.000 χαρακτήρες.

Μπορείτε να αφήσετε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή να ορίσετε τη γλώσσα μόνοι σας για να αυξήσετε την απόδοση και την αξιοπιστία της αναγνώρισης.

Επεξεργασία παρτίδων

Το OCR API σάς απαλλάσσει από την αναγνώριση κάθε εικόνας μία προς μία, προσφέροντας διάφορες μεθόδους επεξεργασίας παρτίδας που σας επιτρέπουν να αναγνωρίζετε πολλές εικόνες σε μία κλήση:

Αναγνώριση πολυσέλιδων αρχείων PDF και TIFF.
Αναγνώριση όλων των αρχείων σε ένα φάκελο.
Αναγνώριση όλων των αρχείων σε ένα αρχείο.

Αναγνώριση αρχείου ZIP - C++

// Παρέχετε τη διαδρομή αρχειοθέτησης
std::string archive_path = "book.zip";

// Προετοιμάστε buffer για το αποτέλεσμα
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Αρχικοποίηση αντικειμένου RecognitionSettings με προεπιλεγμένες τιμές
RecognitionSettings settings;

// Αναγνωρίζω
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Διατήρηση μορφοποίησης

Η βιβλιοθήκη OCR διαβάζει όλες τις δημοφιλείς γραμματοσειρές όπως Arial, Times New Roman, Courier New, Tahoma, Calibri και άλλα σε κανονικά, έντονα και πλάγια στυλ και διατηρεί προσεκτικά τη μορφοποίηση στα αποτελέσματα OCR. Μπορείτε επίσης να χωρίσετε τα αποτελέσματα αναγνώρισης σε γραμμές και να εντοπίσετε περιοχές κειμένου σε μια σελίδα.

Αναγνώριση φωτογραφιών

Η ευρεία υιοθέτηση των εφαρμογών OCR συνήθως διακόπτεται από το γεγονός ότι οι σαρωτές δεν είναι συνηθισμένοι για τους περισσότερους χρήστες. Η βιβλιοθήκη μας OCR διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνων που μπορούν να χειριστούν σκοτεινές, περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Σε συνδυασμό με την υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει την αξιόπιστη αναγνώριση ακόμη και φωτογραφιών smartphone. Το μεγαλύτερο μέρος της προεπεξεργασίας και της διόρθωσης εικόνας γίνεται αυτόματα, οπότε θα χρειαστεί να επέμβετε μόνο σε δύσκολες περιπτώσεις.

Ορίστε προσαρμοσμένη γωνία για διόρθωση λοξής - C++

// Πρωτότυπη εικόνα
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Προετοιμάστε buffer για το αποτέλεσμα
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Ρυθμίστε τη γωνία κλίσης
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Αναγνώριση εικόνας
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Ορθογραφικός έλεγχος

Ενώ το OCR παράγει αξιόπιστα αποτελέσματα, η σκόνη και τα ελαττώματα εκτύπωσης ενδέχεται να προκαλέσουν λανθασμένη αναγνώριση ορισμένων συμβόλων. Το OCR API διαθέτει έναν ενσωματωμένο ορθογραφικό έλεγχο που αντικαθιστά αυτόματα τις ανορθόγραφες λέξεις και σας απαλλάσσει από τη μη αυτόματη διόρθωση των αποτελεσμάτων αναγνώρισης.

Support and Learning Resources

Download Free Trial Pricing Information

Το Aspose προσφέρει επίσης εγγενή API OCR για άλλες δημοφιλείς γλώσσες προγραμματισμού:

Μετατρέψτε εικόνες και PDF σε κείμενο σε C++

Προσθέστε οπτική αναγνώριση χαρακτήρων (OCR) στις εφαρμογές σας C++ με μερικές γραμμές κώδικα.

Aspose.OCR for C++

Overview

Με μια ματιά

Πλατφόρμα Ανεξαρτησίας

Υποστηριζόμενες μορφές αρχείων

Προηγμένες δυνατότητες C++ OCR API

Εύχρηστος

Εικόνα σε κείμενο σε 5 γραμμές - C++

26 Γλώσσες αναγνώρισης

Επεξεργασία παρτίδων

Αναγνώριση αρχείου ZIP - C++

Διατήρηση μορφοποίησης

Αναγνώριση φωτογραφιών

Ορίστε προσαρμοσμένη γωνία για διόρθωση λοξής - C++

Ορθογραφικός έλεγχος

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava