Aspose.OCR  for .NET

Μετατροπή εικόνων και PDF σε κείμενο στο .NET

Προσθέστε οπτική αναγνώριση χαρακτήρων (OCR) στις εφαρμογές σας .NET με μερικές γραμμές κώδικα.

  Download Free Trial
  
 

Το Aspose.OCR για .NET είναι ένα ισχυρό αλλά εύχρηστο και οικονομικό API για οπτική αναγνώριση χαρακτήρων. Με αυτό, μπορείτε να προσθέσετε λειτουργικότητα OCR στις εφαρμογές σας .NET σε λιγότερες από 5 γραμμές κώδικα χωρίς να ανησυχείτε για πολύπλοκα μαθηματικά, νευρωνικά δίκτυα και άλλες τεχνικές λεπτομέρειες. Η εμπειρία μας στις τεχνολογίες μηχανικής εκμάθησης και τα χρόνια ανάπτυξης οδήγησαν σε μια μηχανή OCR με ανώτερη ταχύτητα και ακρίβεια που υποστηρίζει 26 γλώσσες που βασίζονται σε λατινικά και κυριλλικά σενάρια καθώς και στα κινέζικα . Το OCR API μπορεί να αναγνωρίσει σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης, περιοχές εικόνων και σαρωμένα PDF και να επιστρέφει αποτελέσματα στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Διάφορα φίλτρα προεπεξεργασίας σάς επιτρέπουν να αναγνωρίζετε περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Η απόδοση αναγνώρισης και ο φόρτος συστήματος μπορούν να βελτιωθούν περαιτέρω με τη μεταφορά υπολογιστικών εργασιών έντασης πόρων στη GPU .

Χαρακτηριστικά και δυνατότητες του Aspose.OCR για .NET

Μετατρέπει εικόνες και PDF σε κείμενο

Υποστηρίζει όλες τις μορφές εικόνας που μπορείτε να λάβετε από σαρωτή ή κάμερα

Διαβάζει γλώσσες με βάση τα λατινικά και τα κυριλλικά

Αναγνωρίζει περισσότερους από 6.000 κινεζικούς χαρακτήρες

Εντοπίζει και αναγνωρίζει όλες τις δημοφιλείς γραμματοσειρές

Διατηρεί προσεκτικά τα στυλ γραμματοσειράς και τη μορφοποίηση

Επεξεργάζεται μόνο ολόκληρη την εικόνα ή επιλεγμένες περιοχές

Υποστηρίζει περιστρεφόμενες, λοξές και θορυβώδεις εικόνες

Μαζική αναγνώριση όλων των εικόνων σε φάκελο ή αρχείο

Αναγνωρίζει τις εικόνες που παρέχονται ως συνδέσμους Ιστού

Βρίσκει και διορθώνει αυτόματα τις ανορθόγραφες λέξεις

Πλήρως συμβατό με άλλα προϊόντα Aspose

Εύκολο στην εγκατάσταση

Το Aspose.OCR για .NET διανέμεται ως ένα ελαφρύ πακέτο NuGet ή ως αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις. Απλώς εγκαταστήστε το στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε οποιεσδήποτε υποστηριζόμενες γλώσσες και να αποθηκεύσετε τα αποτελέσματα αναγνώρισης σε οποιαδήποτε από τις υποστηριζόμενες μορφές.

Ζητήστε μια προσωρινή άδεια για να ξεκινήσετε τη δημιουργία μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς και περιορισμούς.

Εύχρηστος

Χρειάζεστε τρεις γραμμές κώδικα για να αναγνωρίσετε την εικόνα και να εμφανίσετε το αποτέλεσμα. Ναι, είναι πραγματικά τόσο απλό!

Εικόνα σε κείμενο σε 3 γραμμές - C#

// Εκκινήστε τον κινητήρα OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Αναγνώριση εικόνας σε κείμενο
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Εμφάνιση του αποτελέσματος αναγνώρισης
Console.WriteLine(result);

Cross-Platform

Η βιβλιοθήκη υποστηρίζει πλήρως το .NET Standard 2.0. Σημαίνει ότι οι εφαρμογές μπορούν να εκτελούνται σε οποιαδήποτε πλατφόρμα: Windows desktop, Windows Server, macOS, Linux και cloud.

26 Γλώσσες αναγνώρισης

Το OCR API μπορεί να αναγνωρίσει μεγάλο αριθμό γλωσσών και όλα τα δημοφιλή σενάρια γραφής, συμπεριλαμβανομένων κειμένων με μεικτές γλώσσες.

  • Εκτεταμένο λατινικό αλφάβητο : Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
  • Κυριλλικό αλφάβητο : Λευκορωσικό, Βουλγαρικό, Καζακστάν, Ρωσικό, Σερβικό, Ουκρανικό.
  • Κινέζικα : περισσότεροι από 6.000 χαρακτήρες.

Μπορείτε να αφήσετε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή να ορίσετε τη γλώσσα μόνοι σας για να αυξήσετε την απόδοση και την αξιοπιστία της αναγνώρισης.

Αναγνώριση φωτογραφιών

Το μεγαλύτερο εμπόδιο στις εφαρμογές OCR είναι ότι οι σαρωτές δεν είναι συνηθισμένοι για τους τελικούς χρήστες. Το API διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνας που μπορούν να χειριστούν περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Σε συνδυασμό με την υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει την αξιόπιστη αναγνώριση ακόμη και φωτογραφιών smartphone. Το μεγαλύτερο μέρος της προεπεξεργασίας και της διόρθωσης εικόνας γίνεται αυτόματα, οπότε θα χρειαστεί να επέμβετε μόνο σε δύσκολες περιπτώσεις.

Εφαρμογή αυτόματων διορθώσεων εικόνας - C#

// Εκκινήστε τον κινητήρα OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Ενεργοποιήστε τον αυτόματο υπολογισμό λοξής και αντίθεσης
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Αναγνώριση εικόνας
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Μετατροπέας γενικής χρήσης

Το API μπορεί να διαβάσει κυριολεκτικά οποιαδήποτε εικόνα μπορείτε να λάβετε από έναν σαρωτή, κάμερα ή smartphone: έγγραφα PDF, JPEG, PNG, TIFF, GIF, εικόνες BMP, ακόμη και αρχεία DjVu. Υποστηρίζονται πλήρως έγγραφα PDF πολλών σελίδων, εικόνες TIFF και DjVu. Μπορείτε επίσης να παρέχετε μια εικόνα από τον Ιστό μέσω μιας διεύθυνσης URL.

Τα αποτελέσματα αναγνώρισης επιστρέφονται στις πιο δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.

Αναγνώριση PDF και αποθήκευση αποτελεσμάτων σε JSON - C#

// Εκκινήστε τον κινητήρα OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Αναγνώριση όλων των σελίδων από σαρωμένο PDF
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Εξαγωγή κάθε σελίδας ως JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Βελτιστοποίηση πόρων

Η οπτική αναγνώριση χαρακτήρων είναι μια διαδικασία έντασης πόρων. Το API προσφέρει πολύ ευέλικτους τρόπους για να επιτύχετε μια ισορροπία στην κλασική τριάδα χρόνου-τιμής-ποιότητας:

  • Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
  • Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
  • Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στη GPU.

Γρήγορη αναγνώριση - C#

// Εκκινήστε τον κινητήρα OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Αναγνώριση εικόνας στην ταχύτερη λειτουργία
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Ορθογραφικός έλεγχος

Ενώ το OCR παράγει αξιόπιστα αποτελέσματα, η σκόνη και τα ελαττώματα εκτύπωσης ενδέχεται να προκαλέσουν λανθασμένη αναγνώριση ορισμένων συμβόλων. Το OCR API διαθέτει έναν ενσωματωμένο ορθογραφικό έλεγχο που αντικαθιστά αυτόματα τις ανορθόγραφες λέξεις και σας απαλλάσσει από τη μη αυτόματη διόρθωση των αποτελεσμάτων αναγνώρισης.

Αποτελέσματα αναγνώρισης ορθογραφικού ελέγχου - C#

// Εκκινήστε τον κινητήρα OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Ενεργοποίηση αυτόματης αντίθεσης
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Αναγνώριση εικόνας
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Διορθώστε τις ανορθόγραφες λέξεις
string text =  result.GetSpellCheckCorrectedText();

Επεξεργασία παρτίδων

Το OCR API σάς απαλλάσσει από την αναγνώριση κάθε εικόνας μία προς μία, προσφέροντας διάφορες μεθόδους επεξεργασίας παρτίδας που σας επιτρέπουν να αναγνωρίζετε πολλές εικόνες σε μία κλήση:

  • Αναγνώριση πολυσέλιδων αρχείων PDF, TIFF και DjVu.
  • Αναγνώριση όλων των αρχείων σε ένα φάκελο.
  • Αναγνώριση όλων των αρχείων σε ένα αρχείο.
  • Αναγνώριση όλων των αρχείων από μια λίστα.

Μάθετε με το Παράδειγμα

Το Aspose.OCR για .NET συνοδεύεται από πολλά παραδείγματα γραμμένα σε C# που σας επιτρέπουν να εξοικειωθείτε γρήγορα με τις λειτουργίες και τις δυνατότητές του και σας δίνουν μια ιδέα για τη δημιουργία λύσεων για τις ανάγκες της επιχείρησής σας.

  
  

Το Aspose προσφέρει επίσης εγγενή API OCR για άλλες δημοφιλείς γλώσσες προγραμματισμού: