AI Powered C# OCR Βιβλιοθήκη για εφαρμογές .NET
Μετατρέψτε την εικόνα σε κείμενο στο C# OCR
Περισσότερες βιτρίνες >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Γιατί να επιλέξετε τη βιβλιοθήκη OCR;
Δημιουργήστε ισχυρές δυνατότητες OCR στις εφαρμογές .NET σας σε δευτερόλεπτα. Το εύχρηστο API μας OCR σας επιτρέπει να εξαγάγετε κείμενο από εικόνες και σαρώσεις, να δημιουργείτε PDF που μπορούν να αναζητηθούν και πολλά άλλα με ελάχιστο κωδικό C#. Ιδανικό για λειτουργίες .NET Desktop, Web, Cloud και Server.
εμπειρία OCR που δεν εξάγει μόνο κείμενο, αλλά κατανοεί και ενισχύει το με AI. Κάντε κλικ στα παρακάτω στοιχεία για να μάθετε περισσότερα σχετικά με τα χαρακτηριστικά και τα οφέλη μας.

Παγκόσμιες εφαρμογές OCR
Το C# OCR αναγνωρίζει τα αγγλικά, τα κυριλλικά, τα αραβικά, τα περσικά, τα κινεζικά, τα ιαπωνικά, τα κορεατικά, τα χίντι, το Ταμίλ και τα κείμενα μικτής γλώσσας.
Διαβάστε τα πάντα
Λάβετε κείμενο από οποιοδήποτε αρχείο που λαμβάνεται μέσω σαρωτή ή κάμερας και επεξεργαστείτε εικόνες απευθείας από τους συνδέσμους ιστού.
Αξιόπιστα αποτελέσματα
Επιτύχετε υψηλή ακρίβεια αναγνώρισης για όλες τις εικόνες, συμπεριλαμβανομένων εκείνων που είναι εκτός εστίασης, περιστρεφόμενων, παραμορφωμένων και θορυβώδους.
Αναγνώριση παρτίδας
Χύμα αναγνωρίζουν όλες τις εικόνες από φακέλους και αρχεία. Διαβάστε τα έγγραφα PDF πολλαπλών σελίδων και τις εικόνες TIFF.
Ανίχνευση διάταξης
Προσδιορίστε και κατηγοριοποιήστε τα μπλοκ περιεχομένου στις εικόνες για να εξασφαλίσετε τη σωστή σειρά εκχυλισμένου κειμένου, ανεξάρτητα από τη διάταξη.
AI Postprocessing χρησιμοποιώντας LLMS
Όχι μόνο το OCR-η λύση AI all-in-one για πιο έξυπνη αναγνώριση κειμένου χωρίς σφάλματα. Το Aspose.ocr ενσωματώνει τώρα τα AI και LLMS για να επιλέξουν μοντέλα που ενισχύουν σημαντικά τα σφάλματα ακρίβειας OCR, την αποκατάσταση του κειμένου που λείπουν και τη βελτίωση της συνολικής ποιότητας αναγνώρισης.
Δείγμα ζωντανού κώδικα
Το .NET OCR γίνεται ένα ασήμαντο και απλό έργο με το ASPOSE OCR API, ακόμη και για τους νέους προγραμματιστές. Μόνο μερικές γραμμές κώδικα είναι αρκετές για να εξαγάγουν κείμενο από μια εικόνα και να το εμφανίσουν στην οθόνη. Είναι πραγματικά τόσο απλό - δοκιμάστε το.
* Μεταφορτώντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία που συμφωνείτε με το δικό μας Όροι χρήσης και Πολιτική απορρήτου.
Μετατρέψτε την εικόνα σε κείμενο
Περισσότερα παραδείγματα >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Ανεξαρτησία της πλατφόρμας
Η βιβλιοθήκη OCR Cross-Platform μπορεί να λειτουργήσει παντού κάτω από το .net, .net Core ή .net Framework-είτε σε τοπικό μηχάνημα, στον διακομιστή ιστού είτε στο σύννεφο.
Υποστηριζόμενες μορφές αρχείων
Aspose.OCR for .NET μπορεί να λειτουργήσει με οποιοδήποτε αρχείο Μπορείτε να πάρετε από σαρωτή ή κάμερα. Τα αποτελέσματα της αναγνώρισης μπορούν να αποθηκευτούν, να εισάγονται σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.
Εικόνες
- JPEG
- PNG
- TIFF
- BMP
- GIF
Παρτίδα OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Αποτελέσματα αναγνώρισης
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
LLM-Powered OCR: Η επόμενη γενιά OCR που οδηγείται από μοντέλα γλωσσών AI.
Η ακρίβεια των αποτελεσμάτων δεν σταματά στην αναγνώριση - ξεκλειδώστε το επόμενο επίπεδο ποιότητας με τη διύλιση του κειμένου χρησιμοποιώντας εξωτερικά LLMS.
- Διορθώστε αυτόματα την ορθογραφία και τη γραμματική σε αναγνωρισμένο κείμενο.
- Κανονικοποιήστε τις ασυνέπειες και τα ζητήματα μορφοποίησης σε σαρώσεις πολλαπλών σελίδων.
- Τα αποτελέσματα της αναγνώρισης προσαρμογής στο λεξιλόγιο που σχετίζονται με το θέμα χρησιμοποιώντας μοντέλα που βασίζονται σε προχωρημένα.
- Ενσωματώστε οποιονδήποτε εξωτερικό αγωγό LLM στη ροή εργασίας OCR με λίγες μόνο γραμμές κώδικα.
Κατάλληλο για οποιοδήποτε περιεχόμενο
Η ακρίβεια και η αξιοπιστία της αναγνώρισης κειμένου στο C# εξαρτώνται σε μεγάλο βαθμό από την ποιότητα της εικόνας. Το .NET OCR προσφέρει ένα πλήρες σύνολο αυτοματοποιημένης και χειροκίνητης βελτιστοποίησης εικόνας, εξασφαλίζοντας ανώτερα αποτελέσματα αναγνώρισης.
Η ισχυρή επεξεργασία εικόνας, η πλήρως προσαρμόσιμη ανίχνευση κειμένου, η μετα-επεξεργασία και η αυτοματοποιημένη διόρθωση ορθογραφίας επιτρέπουν την εξαγωγή κειμένου από οποιαδήποτε σάρωση ή φωτογραφία με υψηλότερη ακρίβεια.
Βελτιστοποίηση πόρων OCR
Το Aspose ‘C# OCR Βιβλιοθήκη επιτρέπει εξαιρετικά ευέλικτη εξισορρόπηση της ταχύτητας αναγνώρισης, της ποιότητας και της αξιοποίησης των πόρων για κάθε συγκεκριμένη περίπτωση χρήσης:
- Επιλέξτε μεταξύ της διεξοδικής αναγνώρισης και της γρήγορης αναγνώρισης.
- Καθορίστε τον αριθμό των νημάτων που διατίθενται για αναγνώριση ή αφήστε τη βιβλιοθήκη .NET OCR να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
- Ελευθερώστε τη CPU εκφορτώντας τους υπολογισμούς στη GPU.
140+ γλώσσες αναγνώρισης
Η βιβλιοθήκη C# OCR είναι μια καθολική λύση για την επεξεργασία εγγράφων, την εξαγωγή δεδομένων και την ψηφιοποίηση περιεχομένου σε παγκόσμια κλίμακα. Με την υποστήριξη για μια τεράστια ποικιλία σε σενάρια ευρωπαϊκών, μεσαίων και ασιατικών γραφείων, είναι καλά προσαρμοσμένο σε οποιαδήποτε χώρα και επιχειρήσεις.
Μπορείτε να αναγνωρίσετε έγγραφα γραμμένα σε μικτές γλώσσες, όπως κινεζικά/αγγλικά, αραβικά/γαλλικά ή κυριλλικά/αγγλικά. Υποστηρίζονται οι παρακάτω γλώσσες:
- ** Extended Latin **: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
- ** Cyrillic ** Αλφάβητο: Ρωσικά, Ουκρανικά, Καζακ, βουλγαρικά, συμπεριλαμβανομένων μικτών κυριλλικών/αγγλικών κειμένων.
- Αραβικά, Περσικά, Ουρντού, συμπεριλαμβανομένων κειμένων που αναμιγνύονται με τα αγγλικά.
- Κινέζικα, Κορεατικά, Ιαπωνικά, Ντέβανγκαρη και Dravidian Γλώσσες, συμπεριλαμβανομένου του Χίντι, του Ταμίλ, του Μαράθι και άλλων.
Χαρακτηριστικά και δυνατότητες
Το C# OCR εξάγει αυτόματα κείμενο από φωτογραφίες ή σαρώσεις, εξαλείφοντας την ανάγκη για χειροκίνητη επαναφορά εγγράφων.
Φωτογραφία OCR
Εξαγάγετε κείμενο από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.
Pdf που μπορεί να αναζητηθεί
Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.
Αναγνώριση διεύθυνσης URL
Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.
Αναγνώριση χύδην
Διαβάστε όλες τις εικόνες από έγγραφα πολλαπλών σελίδων, φακέλους και αρχεία.
Οποιαδήποτε γραμματοσειρά και στυλ
Προσδιορίστε και αναγνωρίζετε το κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.
Αναγνώριση τελειοποίησης
Ρυθμίστε κάθε παράμετρο OCR για τα καλύτερα αποτελέσματα αναγνώρισης.
Ορθογραφικός έλεγχος
Βελτιώστε τα αποτελέσματα με αυτόματα τη διόρθωση των ορθογραφικών λέξεων.
Βρείτε κείμενο σε εικόνες
Αναζητήστε κείμενο ή κανονική έκφραση μέσα σε ένα σύνολο εικόνων.
Συγκρίνετε κείμενα εικόνας
Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.
Διόρθωση που τροφοδοτείται με AI
Διορθώστε τις εσφαλμένες γραμμές και τη γραμματική χρησιμοποιώντας LLMS με βάση το μετασχηματιστή-δεν απαιτείται προσαρμοσμένη εκπαίδευση.
Σημασιολογική μετα -επεξεργασία
Πηγαίνετε πέρα από τους χαρακτήρες: Εξηγήστε την παραγωγή θορυβώδους OCR με LLMS για βελτιωμένη ποιότητα περιεχομένου και εξομάλυνση της γλώσσας.
Plug-in αγωγών LLM
Συνδέστε τα μοντέλα εξωτερικής γλώσσας για να διορθώσετε τα λάθη αναγνώρισης OCR και να αποκαταστήσετε ελλιπές ή κατακερματισμένο κείμενο.
Εύκολο στη χρήση OCR
Με το C# OCR API, χρειάζεστε μόνο μερικές γραμμές C# κώδικα για να μετατρέψετε την εικόνα σε κείμενο, να δημιουργήσετε ένα PDF που μπορεί να αναζητήσει, να αποθηκεύσετε τα αποτελέσματα αναγνώρισης για να εγγράφετε και πολλά άλλα. Εξερευνήστε τα δείγματα κώδικα για να καταλάβετε πώς να ενσωματώσετε το API OCR στις λύσεις .NET σας.
Εγκατάσταση
Μπορείτε να αρχίσετε να χρησιμοποιείτε το ASPOSECOR για το .NET αμέσως μετά την εγκατάσταση με ορισμένους περιορισμούς . Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε το για να ξεκινήσετε την οικοδόμηση μιας πλήρως λειτουργικής εφαρμογής OCR και να κάνετε την τελική απόφαση να αγοράσετε το OCR για το .NET αργότερα.
Εξαγάγετε κείμενο από μια φωτογραφία
Όταν οι άνθρωποι συνήθως σκέφτονται το OCR (αναγνώριση οπτικού χαρακτήρα), η πρώτη συσχέτιση είναι συχνά με έναν σαρωτή ως την κύρια συσκευή σύλληψης. Αυτή η συσχέτιση έχει ιστορικούς λόγους και εξακολουθεί να επικρατεί σε πολλά πλαίσια, παρέχοντας σταθερό και ελεγχόμενο περιβάλλον για τη λήψη τυπωμένου κειμένου από φυσικά έγγραφα με απαράμιλλη ποιότητα. Ωστόσο, ένας σαρωτής είναι εξειδικευμένος εξοπλισμός που δεν είναι πάντα διαθέσιμος και απαιτεί ένα σταθερό σταθμό εργασίας για να λειτουργεί. Ευτυχώς, ο σύγχρονος κόσμος παρέχει μια βολική εναλλακτική λύση στους παραδοσιακούς σαρωτές - μια κάμερα smartphone. Οι εξελίξεις στην τεχνολογία της κάμερας smartphone εξασφαλίζουν ότι ακόμη και ένα smartphone εισόδου σε επίπεδο εισόδου παρέχει επαρκή ποιότητα για να καταγράψει έγγραφα που είναι έτοιμα για OCR. Και η ενσωματωμένη μνήμη καθιστά ευκολότερη από ποτέ να ψηφιοποιήσει μεγάλες ποσότητες εγγράφων, εφημερίδων, βιβλίων, πινακίδων δρόμου και άλλων κειμένων εν κινήσει. Το μόνο που χρειάζεστε είναι η σωστή τεχνολογία για να μετατρέψετε αυτές τις φωτογραφίες σε κείμενο αναγνώσιμο από μηχανές.
Η βιβλιοθήκη C# OCR έχει σχεδιαστεί ειδικά για να αναγνωρίζει όλους τους τύπους εικόνων εκτός του κουτιού και μπορεί να ρυθμιστεί περαιτέρω για να χειριστεί ακόμη και τις φωτογραφίες χαμηλής ποιότητας. Σε συνδυασμό με ένα σύγχρονο smartphone, σας επιτρέπει να δημιουργείτε ισχυρές εφαρμογές OCR για τις περισσότερες καθημερινές εργασίες σάρωσης και αναγνώρισης κειμένου. Η πιο προηγμένη επεξεργασία εικόνας και ανάλυση δομής εγγράφων εκτελείται σε μερικές γραμμές κώδικα, επιτρέποντάς σας να εστιάσετε στην επιχείρηση και όχι σε πολύπλοκους μαθηματικούς αλγόριθμους, νευρωνικά δίκτυα και άλλες τεχνικές περιπλοκές.
Φωτογραφία OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Δημιουργήστε ένα PDF που μπορεί να αναζητηθεί από τη σάρωση
Το PDF είναι μία από τις πιο δημοφιλείς μορφές για έγγραφα χαρτιού σάρωσης, ειδικά λόγω της ικανότητάς του να συνδυάζει πολλαπλές σελίδες σε ένα μόνο αρχείο. Αυτή η μορφή χρησιμοποιείται ευρέως για την ανταλλαγή συμβάσεων, τιμολογίων, νομικών εγγράφων, διαβατηρίων και ταυτότητας και πολλά άλλα έγγραφα μεταξύ ατόμων, επιχειρήσεων, τραπεζών και κυβερνητικών υπηρεσιών. Ωστόσο, κάθε σαρωμένο PDF είναι ουσιαστικά μια συλλογή εικόνων. Δεν περιέχει κείμενο αναγνώσιμο από μηχανή, έτσι ώστε οι χρήστες δεν μπορούν να αναζητήσουν, να αντιγράψουν ή να χειριστούν με άλλο τρόπο το περιεχόμενο του εγγράφου.
aspose .NET OCR σας προσφέρει έναν γρήγορο, εύκολο και εξαιρετικά αξιόπιστο τρόπο μετατροπής οποιουδήποτε σαρωμένου PDF σε ένα έγγραφο που μπορεί να αναζητήσει πλήρως και να δελεαστεί. Αναγνωρίζει με ακρίβεια το περιεχόμενο της σελίδας, μετατρέποντάς το σε ένα στρώμα κειμένου με αναγνώσιμο από την αρχική εικόνα, η οποία μπορεί να επιλεγεί, να αντιγραφεί, να διαβάσει με λογισμικό κειμένου σε ομιλία και ακόμη και αυτόματα επεξεργασία από μεταφραστές, summarizers και άλλα εργαλεία ανάλυσης AI.
Προσθήκη επικάλυψης κειμένου στο PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Αναζητήστε κείμενο σε εικόνες
Τα ψηφιακά αρχεία, ειδικά σε μεγάλους οργανισμούς, συχνά αποτελούνται από μια τεράστια συλλογή σαρώσεων και φωτογραφιών, πολλές από τις οποίες ενδέχεται να περιέχουν έγγραφα πολλαπλών σελίδων. Η αποτελεσματική διαχείριση και οργάνωση τέτοιων αρχείων είναι απαραίτητη για την εύκολη ανάκτηση πληροφοριών και την πλοήγηση. Ωστόσο, οι εικόνες δεν περιέχουν κείμενο αναγνώσιμο από μηχανές, καθιστώντας αδύνατη την αναζήτηση και την ανάλυση του περιεχομένου του εγγράφου.
Η βιβλιοθήκη C# OCR σας επιτρέπει να αναζητήσετε εύκολα κείμενο σε εικόνες, ανεξάρτητα από τη γραμματοσειρά, το μέγεθος του κειμένου, το στυλ και άλλες παραμέτρους. Η βιβλιοθήκη υποστηρίζει επίσης τις αναζητήσεις και τις τακτικές εκφράσεις που δεν είναι ευαίσθητες στις περιπτώσεις, οι οποίες είναι εξαιρετικά χρήσιμες σε διάφορες εφαρμογές και βιομηχανίες. Αυτή η λειτουργικότητα μπορεί να χρησιμοποιηθεί για την κατηγοριοποίηση των εγγράφων με βάση το περιεχόμενο, τις λέξεις -κλειδιά ή τα πρότυπα που βρίσκονται στο κείμενο. αναζητώντας συγκεκριμένους όρους ή ρήτρες εντός συμφωνιών και συμβάσεων · αναδιοργάνωση αρχείων με βάση λέξεις -κλειδιά ή περιεχόμενο που βρέθηκαν μέσα σε αυτά. Εντοπίστε και προσδιορίστε τα προσωπικά δεδομένα εντός εγγράφων, διευκολύνοντας την πιο αποτελεσματική την αποτελεσματική συμμόρφωση του GDPR και τη διαχείριση ευαίσθητων πληροφοριών. Η αναζήτηση με εικόνες επιτρέπει επίσης τη δημιουργία αυτοματοποιημένων ροών εργασίας και τον εξορθολογισμό διαφόρων επιχειρηματικών διαδικασιών κατά τη λήψη υπογεγραμμένων συμβάσεων και τιμολογίων.
Αναζητήστε κείμενο σε εικόνες - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}
AI μετά την επεξεργασία με LLM
Τώρα μπορείτε να προχωρήσετε πέρα από την ακατέργαστη αναγνώριση και να εφαρμόσετε τη λογική που βασίζεται στο AI για να βελτιώσετε την ποιότητα των αποτελεσμάτων του OCR. Τα μεγάλα μοντέλα γλωσσών (LLMS) μπορούν να διορθώσουν έξυπνα ορθογραφικά σφάλματα, να επαναφέρουν τα όρια λέξεων, να εφαρμόσουν κανόνες γραμματικής και να προσαρμόσουν το κείμενο με βάση το πλαίσιο-κάτι που δεν μπορούν να κάνουν οι ορθογραφικοί έλεγχοι με βάση τη σύνταξη.
Αυτό το βήμα μετά την επεξεργασία είναι ιδανικό για σαρώσεις χαμηλής ποιότητας, φωτογραφίες με θόρυβο φόντου ή πολύγλωσσα έγγραφα. Μπορείτε να συνδέσετε οποιοδήποτε αγωγό LLM που υποστηρίζει την βασική είσοδο/έξοδο κειμένου ή να χρησιμοποιήσετε τα ενσωματωμένα εργαλεία διόρθωσης της ASPOST για να έχετε αποτελέσματα έτοιμα για παραγωγή.
🧠ai μετά την επεξεργασία με LLM - C#
// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();
// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
AllowAutoDownload = true,
DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};
// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);
// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());
// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);
// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);
// Release resources
aiEngine.Dispose();