Native OCR API για εφαρμογές .NET
Μετατροπή εικόνας σε κείμενο σε C#
Περισσότερες προθήκες >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Γιατί το Aspose.OCR για .NET;
Το Aspose.OCR για .NET είναι ένα ισχυρό, φιλικό προς τους προγραμματιστές και οικονομικά αποδοτικό API για οπτική αναγνώριση χαρακτήρων. Σε λιγότερες από 10 γραμμές εγγενούς κώδικα C#, μπορείτε να δημιουργήσετε δυνατότητες OCR στις λύσεις επιτραπέζιου υπολογιστή .NET, σε εφαρμογές Web που βασίζονται σε MVC, σε υπηρεσίες cloud και σε λειτουργίες Azure χωρίς διακομιστή. Εξάγετε κείμενο αναγνώσιμο από μηχανή από σαρώσεις, φωτογραφίες και στιγμιότυπα οθόνης, μετατρέψτε τις σαρωμένες σελίδες σε PDF με δυνατότητα αναζήτησης και ευρετηρίασης, βρείτε και συγκρίνετε κείμενο σε εικόνες που εστιάζουν σε επαγγελματικές εργασίες και όχι σύνθετα μαθηματικά, νευρωνικά δίκτυα και άλλες τεχνικές περιπλοκές. Κάντε κλικ στα παρακάτω στοιχεία για να μάθετε περισσότερα σχετικά με τις δυνατότητες και τα πλεονεκτήματά μας.
Παγκόσμιες εφαρμογές
Αναγνωρίστε κείμενα σε λατινικά, κυριλλικά και ασιατικά σενάρια, συμπεριλαμβανομένων περισσότερων από 6.000 κινεζικών χαρακτήρων και Χίντι.
Διαβάστε τα πάντα
Ανακτήστε κείμενο από οποιοδήποτε αρχείο που λαμβάνεται μέσω σαρωτή ή κάμερας και επεξεργαστείτε εικόνες απευθείας από συνδέσμους ιστού.
Αξιόπιστα αποτελέσματα
Επιτύχετε υψηλή ακρίβεια αναγνώρισης για όλες τις εικόνες, συμπεριλαμβανομένων εκείνων που είναι εκτός εστίασης, περιστρεφόμενες, παραμορφωμένες και θορυβώδεις.
Αναγνώριση παρτίδας
Μαζική αναγνώριση όλων των εικόνων από φακέλους και αρχεία. διαβάστε έγγραφα PDF πολλών σελίδων και εικόνες TIFF.
Ανίχνευση διάταξης
Προσδιορίστε και κατηγοριοποιήστε μπλοκ περιεχομένου σε εικόνες για να διασφαλίσετε τη σωστή σειρά του εξαγόμενου κειμένου, ανεξάρτητα από τη διάταξη.
Ζωντανό δείγμα κώδικα
Η οπτική αναγνώριση χαρακτήρων γίνεται μια ασήμαντη και απλή εργασία με το Aspose.OCR, ακόμη και για προγραμματιστές που είναι νέοι στην τεχνολογία. Αρκούν λίγες μόνο γραμμές κώδικα για να εξαγάγετε κείμενο από μια εικόνα και να το εμφανίσετε στην οθόνη. Είναι πραγματικά τόσο απλό - δοκιμάστε το.
* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Οροι χρήσης και Πολιτική Απορρήτου.
Μετατροπή εικόνας σε κείμενο
Περισσότερα παραδείγματα >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Ανεξαρτησία πλατφόρμας
Το Aspose.OCR για .NET μπορεί να λειτουργήσει σε οποιαδήποτε πλατφόρμα που υποστηρίζει .NET, .NET Core ή .NET Framework - είτε σε τοπικό μηχανή, στον διακομιστή ιστού ή στο cloud.
Υποστηριζόμενες μορφές αρχείων
Aspose.OCR for .NET μπορεί να λειτουργήσει σχεδόν με οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης επιστρέφονται στις πιο δημοφιλείς μορφές ανταλλαγής αρχείων και δεδομένων που μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.
εικόνες
- JPEG
- PNG
- TIFF
- BMP
- GIF
Παρτίδα OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Αποτελέσματα αναγνώρισης
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Κατάλληλο για οποιοδήποτε περιεχόμενο
Η ακρίβεια και η αξιοπιστία της αναγνώρισης κειμένου εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής εικόνας. Το Aspose.OCR για .NET παρέχει μια εκτεταμένη γκάμα από πλήρως αυτοματοποιημένα και χειροκίνητα φίλτρα επεξεργασίας εικόνας που βελτιώνουν μια εικόνα πριν σταλεί στη μηχανή OCR.
Η ισχυρή επεξεργασία εικόνας και οι προσαρμόσιμοι αλγόριθμοι ανίχνευσης δομής περιεχομένου επιτρέπουν την εξαγωγή κειμένου από σχεδόν οποιαδήποτε εικόνα, από σαρώσεις υψηλής ποιότητας έως φωτογραφίες δρόμου. Μπορούν να εφαρμοστούν πολλαπλά φίλτρα επεξεργασίας στην ίδια εικόνα για να έχετε την καλύτερη ποιότητα αναγνώρισης.
Βελτιστοποίηση πόρων
Το Aspose.OCR για .NET επιτρέπει την εξαιρετικά ευέλικτη εξισορρόπηση της ταχύτητας αναγνώρισης, της ποιότητας και της χρήσης πόρων για κάθε συγκεκριμένη περίπτωση χρήσης:
- Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
- Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
- Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στη GPU.
130+ γλώσσες αναγνώρισης
Το Aspose.OCR για .NET είναι μια καθολική λύση για την επεξεργασία εγγράφων, την εξαγωγή δεδομένων και την ψηφιοποίηση περιεχομένου σε παγκόσμια κλίμακα. Με υποστήριξη για μια τεράστια γκάμα σεναρίων γραφής από την Ευρώπη, τη Μέση Ανατολή και την Ασία, είναι καλά προσαρμοσμένο για κάθε κλίμακα, που απευθύνεται τόσο σε μικρές και μεσαίες επιχειρήσεις όσο και σε πολυεθνικές εταιρείες.
Μπορείτε να αναθέσετε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή να καθορίσετε με μη αυτόματο τρόπο τη γλώσσα, βελτιώνοντας την απόδοση και την αξιοπιστία της αναγνώρισης. Υποστηρίζονται οι ακόλουθες γλώσσες:
- Εκτεταμένο λατινικό αλφάβητο: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
- Κυριλλικό αλφάβητο: Ρώσικα, Ουκρανικά, Καζακικά, Σερβικά, Λευκορωσικά, Βουλγαρικά.
- Αραβικά, Περσικά, Ουρντού;
- Κινεζική και γραφή Devanagari, συμπεριλαμβανομένων των Χίντι, Μαράθι, Μποτζπουρί και άλλων.
Χαρακτηριστικά και δυνατότητες
Το Aspose.OCR για .NET εξάγει αυτόματα κείμενο από φωτογραφίες ή σαρωμένες εικόνες, εξαλείφοντας την ανάγκη μη αυτόματης επανάληψης πληκτρολόγησης εγγράφων.
Φωτογραφία OCR
Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.
PDF με δυνατότητα αναζήτησης
Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.
Αναγνώριση URL
Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.
Μαζική αναγνώριση
Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.
Οποιαδήποτε γραμματοσειρά και στυλ
Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.
Αναγνώριση με ακρίβεια
Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.
Ορθογραφικός έλεγχος
Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.
Βρείτε κείμενο σε εικόνες
Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.
Συγκρίνετε κείμενα εικόνων
Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.
Εύχρηστος
Χρειάζεστε μόνο μερικές γραμμές κώδικα για να μετατρέψετε την εικόνα σε κείμενο, να δημιουργήσετε ένα PDF με δυνατότητα αναζήτησης, να αποθηκεύσετε τα αποτελέσματα αναγνώρισης σε έγγραφο και πολλά άλλα. Εξερευνήστε τα δείγματα κώδικα για να κατανοήσετε πώς να ενσωματώσετε το Aspose.OCR για .NET στις λύσεις σας.
Εγκατάσταση
Μπορείτε να αρχίσετε να χρησιμοποιείτε το Aspose.OCR για .NET αμέσως μετά την εγκατάσταση με ορισμένους περιορισμούς . Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε το για να ξεκινήσετε τη δημιουργία μιας πλήρως λειτουργικής εφαρμογής OCR και να λάβετε την τελική απόφαση να αγοράσετε το Aspose.OCR για .NET αργότερα.
Εξαγωγή κειμένου από φωτογραφία
Όταν οι άνθρωποι συνήθως σκέφτονται το OCR (Optical Character Recognition), η πρώτη συσχέτιση είναι συχνά με έναν σαρωτή ως την κύρια συσκευή λήψης. Αυτή η συσχέτιση έχει ιστορικούς λόγους και εξακολουθεί να επικρατεί σε πολλά περιβάλλοντα, παρέχοντας συνεπές και ελεγχόμενο περιβάλλον για τη λήψη έντυπου κειμένου από φυσικά έγγραφα με απαράμιλλη ποιότητα. Ωστόσο, ένας σαρωτής είναι εξειδικευμένος εξοπλισμός που δεν είναι πάντα διαθέσιμος και απαιτεί σταθερό σταθμό εργασίας για να λειτουργήσει. Ευτυχώς, ο σύγχρονος κόσμος παρέχει μια βολική εναλλακτική λύση στους παραδοσιακούς σαρωτές - μια κάμερα smartphone. Οι εξελίξεις στην τεχνολογία κάμερας smartphone διασφαλίζουν ότι ακόμη και ένα smartphone εισαγωγικού επιπέδου παρέχει επαρκή ποιότητα για τη λήψη εγγράφων με δυνατότητα OCR. Και η ενσωματωμένη μνήμη καθιστά ευκολότερη από ποτέ την ψηφιοποίηση μεγάλων ποσοτήτων εγγράφων, εφημερίδων, βιβλίων, πινακίδων και άλλου κειμένου εν κινήσει. Το μόνο που χρειάζεστε είναι η σωστή τεχνολογία για να μετατρέψετε αυτές τις φωτογραφίες σε κείμενο αναγνώσιμο από μηχανή.
Το Aspose.OCR για .NET έχει σχεδιαστεί ειδικά για να αναγνωρίζει όλους τους τύπους εικόνων out-of-the-box και μπορεί να βελτιωθεί περαιτέρω ώστε να χειρίζεται ακόμα και φωτογραφίες χαμηλής ποιότητας. Σε συνδυασμό με ένα σύγχρονο smartphone, σας επιτρέπει να δημιουργείτε ισχυρές εφαρμογές OCR για τις περισσότερες καθημερινές εργασίες σάρωσης και αναγνώρισης κειμένου. Η πιο προηγμένη επεξεργασία εικόνας και ανάλυση δομής εγγράφων εκτελούνται σε λίγες γραμμές κώδικα, επιτρέποντάς σας να εστιάσετε σε επιχειρήσεις και όχι σε σύνθετους μαθηματικούς αλγόριθμους, νευρωνικά δίκτυα και άλλες τεχνικές περιπλοκές.
Φωτογραφία OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Δημιουργήστε ένα PDF με δυνατότητα αναζήτησης από τη σάρωση
Το PDF είναι μια από τις πιο δημοφιλείς μορφές για τη σάρωση εγγράφων σε χαρτί, ειδικά λόγω της ικανότητάς του να συνδυάζει πολλές σελίδες σε ένα μόνο αρχείο. Αυτή η μορφή χρησιμοποιείται ευρέως για την ανταλλαγή συμβάσεων, τιμολογίων, νομικών εγγράφων, διαβατηρίων και ταυτοτήτων και πολλών άλλων εγγράφων μεταξύ ιδιωτών, επιχειρήσεων, τραπεζών και κρατικών υπηρεσιών. Ωστόσο, κάθε σαρωμένο PDF είναι ουσιαστικά μια συλλογή εικόνων. Δεν περιέχει κείμενο αναγνώσιμο από μηχανή, επομένως οι χρήστες δεν μπορούν να αναζητήσουν, να αντιγράψουν ή να χειριστούν με άλλο τρόπο το περιεχόμενο του εγγράφου.
Το Aspose.OCR για .NET σάς προσφέρει έναν γρήγορο, εύκολο και εξαιρετικά αξιόπιστο τρόπο για να μετατρέψετε οποιοδήποτε σαρωμένο PDF σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση. Αναγνωρίζει με ακρίβεια το περιεχόμενο της σελίδας, μετατρέποντάς το σε ένα επίπεδο κειμένου αναγνώσιμο από μηχανήματα πάνω από την αρχική εικόνα που μπορεί να επιλεγεί, να αντιγραφεί, να διαβαστεί από λογισμικό μετατροπής κειμένου σε ομιλία και ακόμη και να υποβληθεί σε αυτόματη επεξεργασία από μεταφραστές, συνοψιστές και άλλα αναλυτικά στοιχεία που υποστηρίζονται από AI εργαλεία.
Προσθήκη επικάλυψης κειμένου σε PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Αναζήτηση κειμένου σε εικόνες
Τα ψηφιακά αρχεία, ειδικά σε μεγάλους οργανισμούς, αποτελούνται συχνά από μια τεράστια συλλογή σαρώσεων και φωτογραφιών, πολλές από τις οποίες μπορεί να περιέχουν πολυσέλιδα έγγραφα. Η αποτελεσματική διαχείριση και οργάνωση τέτοιων αρχείων είναι ουσιαστική για την εύκολη ανάκτηση και πλοήγηση πληροφοριών. Ωστόσο, οι εικόνες δεν περιέχουν κείμενο αναγνώσιμο από μηχανή, καθιστώντας αδύνατη την αναζήτηση και την ανάλυση του περιεχομένου του εγγράφου.
Το Aspose.OCR για .NET σάς επιτρέπει να αναζητάτε εύκολα κείμενο σε εικόνες, ανεξάρτητα από τη γραμματοσειρά, το μέγεθος του κειμένου, το στυλ και άλλες παραμέτρους. Η βιβλιοθήκη υποστηρίζει επίσης αναζητήσεις χωρίς διάκριση πεζών-κεφαλαίων και κανονικές εκφράσεις, οι οποίες είναι εξαιρετικά χρήσιμες σε διάφορες εφαρμογές και κλάδους. Αυτή η λειτουργία μπορεί να χρησιμοποιηθεί για την κατηγοριοποίηση εγγράφων με βάση το περιεχόμενο, τις λέξεις-κλειδιά ή τα μοτίβα που βρίσκονται στο κείμενο. αναζήτηση συγκεκριμένων όρων ή ρητρών εντός συμφωνιών και συμβάσεων· αναδιοργάνωση αρχείων με βάση τις λέξεις-κλειδιά ή το περιεχόμενο που βρίσκεται σε αυτά· να εντοπίσετε και να αναγνωρίσετε προσωπικά δεδομένα μέσα σε έγγραφα, διευκολύνοντας τη διασφάλιση της συμμόρφωσης με τον GDPR και τη διαχείριση ευαίσθητων πληροφοριών πιο αποτελεσματικά. Η αναζήτηση εντός εικόνων επιτρέπει επίσης τη δημιουργία αυτοματοποιημένων ροών εργασίας και τον εξορθολογισμό διαφόρων επιχειρηματικών διαδικασιών κατά τη λήψη υπογεγραμμένων συμβάσεων και τιμολογίων.
Αναζήτηση κειμένου σε εικόνες - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}