Βιβλιοθήκη C# OCR για εφαρμογές .NET
Μετατροπή εικόνας σε κείμενο σε C# OCR
Περισσότερες προθήκες >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Γιατί να επιλέξετε τη βιβλιοθήκη Aspose OCR;
Δημιουργήστε ισχυρές δυνατότητες OCR στις εφαρμογές σας .NET σε δευτερόλεπτα. Το εύχρηστο OCR API σάς επιτρέπει να εξάγετε κείμενο από εικόνες και σαρώσεις, να δημιουργείτε PDF με δυνατότητα αναζήτησης και πολλά άλλα με ελάχιστο κώδικα C#. Ιδανικό για .NET επιτραπέζιους υπολογιστές, web, cloud και λειτουργίες χωρίς διακομιστή. Κάντε κλικ στα παρακάτω στοιχεία για να μάθετε περισσότερα σχετικά με τις δυνατότητες και τα πλεονεκτήματά μας.

Παγκόσμιες εφαρμογές OCR
Το C# OCR αναγνωρίζει κείμενα Αγγλικά, Κυριλλικά, Αραβικά, Περσικά, Κινέζικα, Ιαπωνικά, Κορεατικά, Χίντι, Ταμίλ και κείμενα μεικτής γλώσσας.
Διαβάστε τα πάντα
Λάβετε κείμενο από οποιοδήποτε αρχείο που λαμβάνεται μέσω σαρωτή ή κάμερας και επεξεργαστείτε εικόνες απευθείας από συνδέσμους ιστού.
Αξιόπιστα αποτελέσματα
Επιτύχετε υψηλή ακρίβεια αναγνώρισης για όλες τις εικόνες, συμπεριλαμβανομένων εκείνων που είναι εκτός εστίασης, περιστρεφόμενες, παραμορφωμένες και θορυβώδεις.
Αναγνώριση παρτίδας
Μαζική αναγνώριση όλων των εικόνων από φακέλους και αρχεία. διαβάστε έγγραφα PDF πολλών σελίδων και εικόνες TIFF.
Ανίχνευση διάταξης
Προσδιορίστε και κατηγοριοποιήστε μπλοκ περιεχομένου σε εικόνες για να διασφαλίσετε τη σωστή σειρά του εξαγόμενου κειμένου, ανεξάρτητα από τη διάταξη.
Ζωντανό δείγμα κώδικα
Το .NET OCR γίνεται μια ασήμαντη και απλή εργασία με το Aspose OCR API, ακόμη και για νέους προγραμματιστές. Αρκούν λίγες μόνο γραμμές κώδικα για να εξαγάγετε κείμενο από μια εικόνα και να το εμφανίσετε στην οθόνη. Είναι πραγματικά τόσο απλό - δοκιμάστε το.
* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Όροι χρήσης και Πολιτική Απορρήτου.
Μετατροπή εικόνας σε κείμενο
Περισσότερα παραδείγματα >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Ανεξαρτησία πλατφόρμας
Η βιβλιοθήκη OCR πολλαπλών πλατφορμών μπορεί να λειτουργήσει παντού στο .NET, .NET Core ή .NET Framework - είτε σε τοπικό μηχάνημα, στο διακομιστή ιστού ή στο cloud.
Υποστηριζόμενες μορφές αρχείων
Aspose.OCR for .NET μπορεί να λειτουργήσει με οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.
εικόνες
- JPEG
- PNG
- TIFF
- BMP
- GIF
Παρτίδα OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Αποτελέσματα αναγνώρισης
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Κατάλληλο για οποιοδήποτε περιεχόμενο
Η ακρίβεια και η αξιοπιστία της αναγνώρισης κειμένου σε C# εξαρτώνται σε μεγάλο βαθμό από την ποιότητα της εικόνας. Το .NET OCR προσφέρει ένα πλήρες σετ αυτοματοποιημένης και μη αυτόματης βελτιστοποίησης εικόνας, εξασφαλίζοντας ανώτερα αποτελέσματα αναγνώρισης.
Η ισχυρή επεξεργασία εικόνας, η πλήρως προσαρμόσιμη ανίχνευση κειμένου, η μετα-επεξεργασία και η αυτοματοποιημένη ορθογραφική διόρθωση επιτρέπουν την εξαγωγή κειμένου από οποιαδήποτε σάρωση ή φωτογραφία με την υψηλότερη ακρίβεια.
Βελτιστοποίηση πόρων OCR
Η βιβλιοθήκη Aspose’ C# OCR επιτρέπει την εξαιρετικά ευέλικτη εξισορρόπηση της ταχύτητας αναγνώρισης, της ποιότητας και της χρήσης πόρων για κάθε συγκεκριμένη περίπτωση χρήσης:
- Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
- Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη .NET OCR να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
- Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στη GPU.
140+ γλώσσες αναγνώρισης
Η βιβλιοθήκη μας C# OCR είναι μια καθολική λύση για την επεξεργασία εγγράφων, την εξαγωγή δεδομένων και την ψηφιοποίηση περιεχομένου σε παγκόσμια κλίμακα. Με υποστήριξη για μια τεράστια γκάμα σεναρίων γραφής από την Ευρώπη, τη Μέση Ανατολή και την Ασία, είναι καλά προσαρμοσμένο για κάθε χώρα και επιχείρηση.
Μπορείτε να αναγνωρίσετε έγγραφα γραμμένα σε μεικτές γλώσσες, όπως Κινεζικά/Αγγλικά, Αραβικά/Γαλλικά ή Κυριλλικά/Αγγλικά. Υποστηρίζονται οι ακόλουθες γλώσσες:
- Εκτεταμένα Λατινικά: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
- Κυριλλικό αλφάβητο: Ρωσικά, Ουκρανικά, Καζακικά, Βουλγαρικά, συμπεριλαμβανομένων μικτών κυριλλικών/αγγλικών κειμένων.
- Αραβικά, Περσικά, Ουρντού, συμπεριλαμβανομένων κειμένων ανάμεικτα με αγγλικά.
- Κινεζικά, Κορεατικά, Ιαπωνικά, Devanagari και Δραβιδικές γλώσσες, συμπεριλαμβανομένων των Χίντι, Ταμίλ, Μαράθι και άλλων.
Χαρακτηριστικά και δυνατότητες
Το C# OCR εξάγει αυτόματα κείμενο από φωτογραφίες ή σαρώσεις, εξαλείφοντας την ανάγκη για μη αυτόματη επανεισαγωγή εγγράφων.
Φωτογραφία OCR
Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.
PDF με δυνατότητα αναζήτησης
Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.
Αναγνώριση URL
Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.
Μαζική αναγνώριση
Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.
Οποιαδήποτε γραμματοσειρά και στυλ
Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.
Αναγνώριση με ακρίβεια
Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.
Ορθογραφικός έλεγχος
Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.
Βρείτε κείμενο σε εικόνες
Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.
Συγκρίνετε κείμενα εικόνων
Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.
Εύκολο στη χρήση OCR
Με το C# OCR API, χρειάζεστε μόνο μερικές γραμμές κώδικα C# για να μετατρέψετε την εικόνα σε κείμενο, να δημιουργήσετε ένα PDF με δυνατότητα αναζήτησης, να αποθηκεύσετε τα αποτελέσματα αναγνώρισης σε έγγραφα και πολλά άλλα. Εξερευνήστε τα δείγματα κώδικα για να κατανοήσετε πώς να ενσωματώσετε το OCR API στις λύσεις σας .NET.
Εγκατάσταση
Μπορείτε να αρχίσετε να χρησιμοποιείτε το Aspose OCR για .NET αμέσως μετά την εγκατάσταση με ορισμένους περιορισμούς . Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε το για να ξεκινήσετε τη δημιουργία μιας πλήρως λειτουργικής εφαρμογής OCR και να λάβετε την τελική απόφαση να αγοράσετε το OCR για .NET αργότερα.
Εξαγωγή κειμένου από φωτογραφία
Όταν οι άνθρωποι συνήθως σκέφτονται το OCR (Optical Character Recognition), η πρώτη συσχέτιση είναι συχνά με έναν σαρωτή ως την κύρια συσκευή λήψης. Αυτή η συσχέτιση έχει ιστορικούς λόγους και εξακολουθεί να επικρατεί σε πολλά περιβάλλοντα, παρέχοντας συνεπές και ελεγχόμενο περιβάλλον για τη λήψη έντυπου κειμένου από φυσικά έγγραφα με απαράμιλλη ποιότητα. Ωστόσο, ένας σαρωτής είναι εξειδικευμένος εξοπλισμός που δεν είναι πάντα διαθέσιμος και απαιτεί σταθερό σταθμό εργασίας για να λειτουργήσει. Ευτυχώς, ο σύγχρονος κόσμος παρέχει μια βολική εναλλακτική λύση στους παραδοσιακούς σαρωτές - μια κάμερα smartphone. Οι εξελίξεις στην τεχνολογία κάμερας smartphone διασφαλίζουν ότι ακόμη και ένα smartphone εισαγωγικού επιπέδου παρέχει επαρκή ποιότητα για τη λήψη εγγράφων με δυνατότητα OCR. Και η ενσωματωμένη μνήμη καθιστά ευκολότερη από ποτέ την ψηφιοποίηση μεγάλων ποσοτήτων εγγράφων, εφημερίδων, βιβλίων, πινακίδων και άλλου κειμένου εν κινήσει. Το μόνο που χρειάζεστε είναι η σωστή τεχνολογία για να μετατρέψετε αυτές τις φωτογραφίες σε κείμενο αναγνώσιμο από μηχανή.
Η βιβλιοθήκη μας C# OCR έχει σχεδιαστεί ειδικά για να αναγνωρίζει όλους τους τύπους εικόνων out-of-the-box και μπορεί να βελτιωθεί περαιτέρω ώστε να χειρίζεται ακόμη και φωτογραφίες χαμηλής ποιότητας. Σε συνδυασμό με ένα σύγχρονο smartphone, σας επιτρέπει να δημιουργείτε ισχυρές εφαρμογές OCR για τις περισσότερες καθημερινές εργασίες σάρωσης και αναγνώρισης κειμένου. Η πιο προηγμένη επεξεργασία εικόνας και ανάλυση δομής εγγράφων εκτελούνται σε λίγες γραμμές κώδικα, επιτρέποντάς σας να εστιάσετε σε επιχειρήσεις και όχι σε σύνθετους μαθηματικούς αλγόριθμους, νευρωνικά δίκτυα και άλλες τεχνικές περιπλοκές.
Φωτογραφία OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Δημιουργήστε ένα PDF με δυνατότητα αναζήτησης από τη σάρωση
Το PDF είναι μια από τις πιο δημοφιλείς μορφές για τη σάρωση εγγράφων σε χαρτί, ειδικά λόγω της ικανότητάς του να συνδυάζει πολλές σελίδες σε ένα μόνο αρχείο. Αυτή η μορφή χρησιμοποιείται ευρέως για την ανταλλαγή συμβάσεων, τιμολογίων, νομικών εγγράφων, διαβατηρίων και ταυτοτήτων και πολλών άλλων εγγράφων μεταξύ ιδιωτών, επιχειρήσεων, τραπεζών και κρατικών υπηρεσιών. Ωστόσο, κάθε σαρωμένο PDF είναι ουσιαστικά μια συλλογή εικόνων. Δεν περιέχει κείμενο αναγνώσιμο από μηχανή, επομένως οι χρήστες δεν μπορούν να αναζητήσουν, να αντιγράψουν ή να χειριστούν με άλλο τρόπο το περιεχόμενο του εγγράφου.
Το Aspose .NET OCR σάς προσφέρει έναν γρήγορο, εύκολο και εξαιρετικά αξιόπιστο τρόπο για να μετατρέψετε οποιοδήποτε σαρωμένο PDF σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση. Αναγνωρίζει με ακρίβεια το περιεχόμενο της σελίδας, μετατρέποντάς το σε ένα επίπεδο κειμένου αναγνώσιμο από μηχανήματα πάνω από την αρχική εικόνα που μπορεί να επιλεγεί, να αντιγραφεί, να διαβαστεί από λογισμικό μετατροπής κειμένου σε ομιλία και ακόμη και να υποβληθεί σε αυτόματη επεξεργασία από μεταφραστές, συνοψιστές και άλλα αναλυτικά στοιχεία που υποστηρίζονται από AI εργαλεία.
Προσθήκη επικάλυψης κειμένου σε PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Αναζήτηση κειμένου σε εικόνες
Τα ψηφιακά αρχεία, ειδικά σε μεγάλους οργανισμούς, αποτελούνται συχνά από μια τεράστια συλλογή σαρώσεων και φωτογραφιών, πολλές από τις οποίες μπορεί να περιέχουν πολυσέλιδα έγγραφα. Η αποτελεσματική διαχείριση και αποτελεσματική οργάνωση τέτοιων αρχείων είναι απαραίτητη για την εύκολη ανάκτηση και πλοήγηση πληροφοριών. Ωστόσο, οι εικόνες δεν περιέχουν κείμενο αναγνώσιμο από μηχανή, καθιστώντας αδύνατη την αναζήτηση και την ανάλυση του περιεχομένου του εγγράφου.
Η βιβλιοθήκη C# OCR σάς επιτρέπει να αναζητάτε εύκολα κείμενο σε εικόνες, ανεξάρτητα από τη γραμματοσειρά, το μέγεθος του κειμένου, το στυλ και άλλες παραμέτρους. Η βιβλιοθήκη υποστηρίζει επίσης αναζητήσεις χωρίς διάκριση πεζών-κεφαλαίων και κανονικές εκφράσεις, οι οποίες είναι εξαιρετικά χρήσιμες σε διάφορες εφαρμογές και κλάδους. Αυτή η λειτουργία μπορεί να χρησιμοποιηθεί για την κατηγοριοποίηση εγγράφων με βάση το περιεχόμενο, τις λέξεις-κλειδιά ή τα μοτίβα που βρίσκονται στο κείμενο. αναζήτηση συγκεκριμένων όρων ή ρητρών εντός συμφωνιών και συμβάσεων· αναδιοργάνωση αρχείων με βάση τις λέξεις-κλειδιά ή το περιεχόμενο που βρίσκεται μέσα σε αυτά· να εντοπίσετε και να αναγνωρίσετε προσωπικά δεδομένα μέσα σε έγγραφα, διευκολύνοντας τη διασφάλιση της συμμόρφωσης με τον GDPR και τη διαχείριση ευαίσθητων πληροφοριών πιο αποτελεσματικά. Η αναζήτηση εντός εικόνων επιτρέπει επίσης τη δημιουργία αυτοματοποιημένων ροών εργασίας και τον εξορθολογισμό διαφόρων επιχειρηματικών διαδικασιών κατά τη λήψη υπογεγραμμένων συμβολαίων και τιμολογίων.
Αναζήτηση κειμένου σε εικόνες - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}