Γιατί το Aspose.OCR για .NET;

Το Aspose.OCR για .NET είναι ένα ισχυρό, φιλικό προς τους προγραμματιστές και οικονομικά αποδοτικό API για οπτική αναγνώριση χαρακτήρων. Σε λιγότερες από 10 γραμμές εγγενούς κώδικα C#, μπορείτε να δημιουργήσετε δυνατότητες OCR στις λύσεις επιτραπέζιου υπολογιστή .NET, σε εφαρμογές Web που βασίζονται σε MVC, σε υπηρεσίες cloud και σε λειτουργίες Azure χωρίς διακομιστή. Εξάγετε κείμενο αναγνώσιμο από μηχανή από σαρώσεις, φωτογραφίες και στιγμιότυπα οθόνης, μετατρέψτε τις σαρωμένες σελίδες σε PDF με δυνατότητα αναζήτησης και ευρετηρίασης, βρείτε και συγκρίνετε κείμενο σε εικόνες που εστιάζουν σε επαγγελματικές εργασίες και όχι σύνθετα μαθηματικά, νευρωνικά δίκτυα και άλλες τεχνικές περιπλοκές. Κάντε κλικ στα παρακάτω στοιχεία για να μάθετε περισσότερα σχετικά με τις δυνατότητες και τα πλεονεκτήματά μας.

Illustration ocr

Παγκόσμιες εφαρμογές

Αναγνωρίστε κείμενα σε λατινικά, κυριλλικά και ασιατικά σενάρια, συμπεριλαμβανομένων περισσότερων από 6.000 κινεζικών χαρακτήρων και Χίντι.

Διαβάστε τα πάντα

Ανάκτηση κειμένου από οποιοδήποτε αρχείο που λαμβάνεται μέσω σαρωτή ή κάμερας και επεξεργασία εικόνων απευθείας από συνδέσμους Ιστού.

Αξιόπιστα αποτελέσματα

Επιτύχετε υψηλή ακρίβεια αναγνώρισης για όλες τις εικόνες, συμπεριλαμβανομένων εκείνων που είναι εκτός εστίασης, περιστρεφόμενες, παραμορφωμένες και θορυβώδεις.

Αναγνώριση παρτίδας

Μαζική αναγνώριση όλων των εικόνων από φακέλους και αρχεία. διαβάστε έγγραφα PDF πολλών σελίδων και εικόνες TIFF.

Ανίχνευση διάταξης

Προσδιορίστε και κατηγοριοποιήστε μπλοκ περιεχομένου σε εικόνες για να διασφαλίσετε τη σωστή σειρά του εξαγόμενου κειμένου, ανεξάρτητα από τη διάταξη.

Ζωντανό δείγμα κώδικα

Η οπτική αναγνώριση χαρακτήρων γίνεται μια ασήμαντη και απλή εργασία με το Aspose.OCR, ακόμη και για προγραμματιστές που είναι νέοι στην τεχνολογία. Αρκούν λίγες μόνο γραμμές κώδικα για να εξαγάγετε κείμενο από μια εικόνα και να το εμφανίσετε στην οθόνη. Είναι πραγματικά τόσο απλό - δοκιμάστε το.

Έτοιμος να αναγνωρίσει Έτοιμος να αναγνωρίσει Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για περιήγηση *

* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Οροι χρήσης και Πολιτική Απορρήτου.

Αποτέλεσμα αναγνώρισης
 

Μετατροπή εικόνας σε κείμενο

Περισσότερα παραδείγματα >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Ανεξαρτησία πλατφόρμας

Το Aspose.OCR για .NET μπορεί να λειτουργήσει σε οποιαδήποτε πλατφόρμα που υποστηρίζει .NET, .NET Core ή .NET Framework - είτε σε τοπικό μηχανή, στον διακομιστή ιστού ή στο cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Υποστηριζόμενες μορφές αρχείων

Aspose.OCR for .NET μπορεί να λειτουργήσει με σχεδόν οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης επιστρέφονται στις πιο δημοφιλείς μορφές ανταλλαγής αρχείων και δεδομένων που μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.

εικόνες

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Παρτίδα OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Αποτελέσματα αναγνώρισης

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Κατάλληλο για οποιοδήποτε περιεχόμενο

Η ακρίβεια και η αξιοπιστία της αναγνώρισης κειμένου εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής εικόνας. Το Aspose.OCR για .NET παρέχει μια εκτεταμένη γκάμα από πλήρως αυτοματοποιημένα και χειροκίνητα φίλτρα επεξεργασίας εικόνας που βελτιώνουν μια εικόνα πριν σταλεί στη μηχανή OCR.

Η ισχυρή επεξεργασία εικόνας και οι προσαρμόσιμοι αλγόριθμοι ανίχνευσης δομής περιεχομένου επιτρέπουν την εξαγωγή κειμένου από σχεδόν οποιαδήποτε εικόνα, από σαρώσεις υψηλής ποιότητας έως φωτογραφίες δρόμου. Μπορούν να εφαρμοστούν πολλαπλά φίλτρα επεξεργασίας στην ίδια εικόνα για να έχετε την καλύτερη ποιότητα αναγνώρισης.

Βελτιστοποίηση πόρων

Το Aspose.OCR για .NET επιτρέπει την εξαιρετικά ευέλικτη εξισορρόπηση της ταχύτητας αναγνώρισης, της ποιότητας και της χρήσης πόρων για κάθε συγκεκριμένη περίπτωση χρήσης:

  • Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
  • Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
  • Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στη GPU.

28 γλώσσες αναγνώρισης

Το Aspose.OCR για .NET είναι μια καθολική λύση για την επεξεργασία εγγράφων, την εξαγωγή δεδομένων και την ψηφιοποίηση περιεχομένου σε παγκόσμια κλίμακα. Με υποστήριξη για μια τεράστια ποικιλία ευρωπαϊκών και ασιατικών σεναρίων γραφής, είναι καλά προσαρμοσμένο για κάθε κλίμακα, για μικρές και μεσαίες επιχειρήσεις καθώς και πολυεθνικές εταιρείες.

Μπορείτε να αναθέσετε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή να καθορίσετε με μη αυτόματο τρόπο τη γλώσσα, βελτιώνοντας την απόδοση και την αξιοπιστία της αναγνώρισης. Υποστηρίζονται οι ακόλουθες γλώσσες:

  • Εκτεταμένο λατινικό αλφάβητο: Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
  • Κυριλλικό αλφάβητο: Λευκορωσικά, Βουλγαρικά, Καζακικά, Ρωσικά, Σερβικά, Ουκρανικά.
  • Πάνω από 6.000 Κινεζικοί χαρακτήρες.
  • Χίντι.

Χαρακτηριστικά και δυνατότητες

Το Aspose.OCR για .NET εξάγει αυτόματα κείμενο από φωτογραφίες ή σαρωμένες εικόνες, εξαλείφοντας την ανάγκη για μη αυτόματη επαναπληκτρολόγηση εγγράφων.

Feature icon

Φωτογραφία OCR

Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.

Feature icon

PDF με δυνατότητα αναζήτησης

Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.

Feature icon

Αναγνώριση URL

Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.

Feature icon

Μαζική αναγνώριση

Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.

Feature icon

Οποιαδήποτε γραμματοσειρά και στυλ

Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.

Feature icon

Αναγνώριση με ακρίβεια

Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.

Feature icon

Ορθογραφικός έλεγχος

Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.

Feature icon

Βρείτε κείμενο σε εικόνες

Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.

Feature icon

Συγκρίνετε κείμενα εικόνων

Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.

Εύχρηστος

Χρειάζεστε μόνο μερικές γραμμές κώδικα για να μετατρέψετε την εικόνα σε κείμενο, να δημιουργήσετε ένα PDF με δυνατότητα αναζήτησης, να αποθηκεύσετε τα αποτελέσματα αναγνώρισης σε έγγραφο και πολλά άλλα. Εξερευνήστε τα δείγματα κώδικα για να κατανοήσετε πώς να ενσωματώσετε το Aspose.OCR για .NET στις λύσεις σας.

Εγκατάσταση

Το Aspose.OCR για .NET διανέμεται ως πακέτο NuGet ή ως [αρχείο με δυνατότητα λήψης]( https://releases.aspose.com/ ocr/net/) με ελάχιστες εξαρτήσεις. Το πακέτο μπορεί να προστεθεί στο έργο σας απευθείας από το Microsoft Visual Studio. Απλώς εγκαταστήστε το στο έργο σας και είστε έτοιμοι να εξαγάγετε κείμενο από εικόνες και να αποθηκεύσετε αποτελέσματα αναγνώρισης σε οποιαδήποτε από τις υποστηριζόμενες μορφές. Εάν το σύστημά σας διαθέτει GPU με δυνατότητα CUDA, μπορείτε να χρησιμοποιήσετε τη μηχανή OCR με επιτάχυνση GPU για να αυξήσετε σημαντικά την απόδοση αναγνώρισης.

Μπορείτε να αρχίσετε να χρησιμοποιείτε το Aspose.OCR για .NET αμέσως μετά την εγκατάσταση με ορισμένους περιορισμούς . Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε το για να ξεκινήσετε τη δημιουργία μιας πλήρως λειτουργικής εφαρμογής OCR και να λάβετε την τελική απόφαση να αγοράσετε το Aspose.OCR για .NET αργότερα.

Εξαγωγή κειμένου από φωτογραφία

Όταν οι άνθρωποι συνήθως σκέφτονται το OCR (Optical Character Recognition), η πρώτη συσχέτιση είναι συχνά με έναν σαρωτή ως την κύρια συσκευή λήψης. Αυτή η συσχέτιση έχει ιστορικούς λόγους και εξακολουθεί να επικρατεί σε πολλά περιβάλλοντα, παρέχοντας συνεπές και ελεγχόμενο περιβάλλον για τη λήψη έντυπου κειμένου από φυσικά έγγραφα με απαράμιλλη ποιότητα. Ωστόσο, ένας σαρωτής είναι εξειδικευμένος εξοπλισμός που δεν είναι πάντα διαθέσιμος και απαιτεί σταθερό σταθμό εργασίας για να λειτουργήσει. Ευτυχώς, ο σύγχρονος κόσμος παρέχει μια βολική εναλλακτική λύση στους παραδοσιακούς σαρωτές - μια κάμερα smartphone. Οι εξελίξεις στην τεχνολογία κάμερας smartphone διασφαλίζουν ότι ακόμη και ένα smartphone εισαγωγικού επιπέδου παρέχει επαρκή ποιότητα για τη λήψη εγγράφων με δυνατότητα OCR. Και η ενσωματωμένη μνήμη καθιστά ευκολότερη από ποτέ την ψηφιοποίηση μεγάλων ποσοτήτων εγγράφων, εφημερίδων, βιβλίων, πινακίδων και άλλου κειμένου εν κινήσει. Το μόνο που χρειάζεστε είναι η σωστή τεχνολογία για να μετατρέψετε αυτές τις φωτογραφίες σε κείμενο αναγνώσιμο από μηχανή.

Το Aspose.OCR για .NET έχει σχεδιαστεί ειδικά για να αναγνωρίζει όλους τους τύπους εικόνων out-of-the-box και μπορεί να βελτιωθεί περαιτέρω ώστε να χειρίζεται ακόμα και φωτογραφίες χαμηλής ποιότητας. Σε συνδυασμό με ένα σύγχρονο smartphone, σας επιτρέπει να δημιουργείτε ισχυρές εφαρμογές OCR για τις περισσότερες καθημερινές εργασίες σάρωσης και αναγνώρισης κειμένου. Η πιο προηγμένη επεξεργασία εικόνας και ανάλυση δομής εγγράφων εκτελούνται σε λίγες γραμμές κώδικα, επιτρέποντάς σας να εστιάσετε σε επιχειρήσεις και όχι σε σύνθετους μαθηματικούς αλγόριθμους, νευρωνικά δίκτυα και άλλες τεχνικές περιπλοκές.

Φωτογραφία OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Δημιουργήστε ένα PDF με δυνατότητα αναζήτησης από τη σάρωση

Το PDF είναι μια από τις πιο δημοφιλείς μορφές για τη σάρωση εγγράφων σε χαρτί, ειδικά λόγω της ικανότητάς του να συνδυάζει πολλές σελίδες σε ένα μόνο αρχείο. Αυτή η μορφή χρησιμοποιείται ευρέως για την ανταλλαγή συμβάσεων, τιμολογίων, νομικών εγγράφων, διαβατηρίων και ταυτοτήτων και πολλών άλλων εγγράφων μεταξύ ιδιωτών, επιχειρήσεων, τραπεζών και κρατικών υπηρεσιών. Ωστόσο, κάθε σαρωμένο PDF είναι ουσιαστικά μια συλλογή εικόνων. Δεν περιέχει κείμενο αναγνώσιμο από μηχανή, επομένως οι χρήστες δεν μπορούν να αναζητήσουν, να αντιγράψουν ή να χειριστούν με άλλο τρόπο το περιεχόμενο του εγγράφου.

Το Aspose.OCR για .NET σάς προσφέρει έναν γρήγορο, εύκολο και εξαιρετικά αξιόπιστο τρόπο για να μετατρέψετε οποιοδήποτε σαρωμένο PDF σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση. Αναγνωρίζει με ακρίβεια το περιεχόμενο της σελίδας, μετατρέποντάς το σε ένα επίπεδο κειμένου αναγνώσιμο από μηχανή πάνω από την αρχική εικόνα που μπορεί να επιλεγεί, να αντιγραφεί, να διαβαστεί από λογισμικό μετατροπής κειμένου σε ομιλία και ακόμη και να υποβληθεί σε αυτόματη επεξεργασία από μεταφραστές, συνοψιστές και άλλα αναλυτικά στοιχεία που υποστηρίζονται από AI εργαλεία.

Προσθήκη επικάλυψης κειμένου σε PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Αναζήτηση κειμένου σε εικόνες

Τα ψηφιακά αρχεία, ειδικά σε μεγάλους οργανισμούς, αποτελούνται συχνά από μια τεράστια συλλογή σαρώσεων και φωτογραφιών, πολλές από τις οποίες μπορεί να περιέχουν πολυσέλιδα έγγραφα. Η αποτελεσματική διαχείριση και αποτελεσματική οργάνωση τέτοιων αρχείων είναι απαραίτητη για την εύκολη ανάκτηση και πλοήγηση πληροφοριών. Ωστόσο, οι εικόνες δεν περιέχουν κείμενο αναγνώσιμο από μηχανή, καθιστώντας αδύνατη την αναζήτηση και την ανάλυση του περιεχομένου του εγγράφου.

Το Aspose.OCR για .NET σάς επιτρέπει να αναζητάτε εύκολα κείμενο σε εικόνες, ανεξάρτητα από τη γραμματοσειρά, το μέγεθος του κειμένου, το στυλ και άλλες παραμέτρους. Η βιβλιοθήκη υποστηρίζει επίσης αναζητήσεις χωρίς διάκριση πεζών-κεφαλαίων και κανονικές εκφράσεις, οι οποίες είναι εξαιρετικά χρήσιμες σε διάφορες εφαρμογές και κλάδους. Αυτή η λειτουργία μπορεί να χρησιμοποιηθεί για την κατηγοριοποίηση εγγράφων με βάση το περιεχόμενο, τις λέξεις-κλειδιά ή τα μοτίβα που βρίσκονται στο κείμενο. αναζήτηση συγκεκριμένων όρων ή ρητρών εντός συμφωνιών και συμβάσεων· αναδιοργάνωση αρχείων με βάση τις λέξεις-κλειδιά ή το περιεχόμενο που βρίσκεται μέσα σε αυτά· να εντοπίσετε και να αναγνωρίσετε προσωπικά δεδομένα μέσα σε έγγραφα, διευκολύνοντας τη διασφάλιση της συμμόρφωσης με τον GDPR και τη διαχείριση ευαίσθητων πληροφοριών πιο αποτελεσματικά. Η αναζήτηση εντός εικόνων επιτρέπει επίσης τη δημιουργία αυτοματοποιημένων ροών εργασίας και τον εξορθολογισμό διαφόρων επιχειρηματικών διαδικασιών κατά τη λήψη υπογεγραμμένων συμβάσεων και τιμολογίων.

Αναζήτηση κειμένου σε εικόνες - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}