Μετατροπή εικόνων και PDF σε κείμενο σε Java
Δημιουργήστε εύκολα εφαρμογές Java σε πολλαπλές πλατφόρμες με δυνατότητες οπτικής αναγνώρισης χαρακτήρων (OCR).
Download Free TrialΤο Aspose.OCR για Java σάς επιτρέπει να εξάγετε κείμενο από εικόνες, στιγμιότυπα οθόνης, συγκεκριμένες περιοχές μιας εικόνας και να δημιουργείτε PDF με δυνατότητα αναζήτησης από σαρωμένα αρχεία σε οποιαδήποτε πλατφόρμα που υποστηρίζει Java. Με το ισχυρό αλλά εύχρηστο API του, ακόμη και οι πολύπλοκες εργασίες OCR απαιτούν λιγότερες από 10 γραμμές κώδικα. Δεν χρειάζεται να εργαστείτε με τύπους και μηχανική εκμάθηση - η βιβλιοθήκη θα φροντίσει για όλες τις τεχνικές λεπτομέρειες και θα παράγει αξιόπιστα αποτελέσματα σε 26 γλώσσες με βάση λατινικά και κυριλλικά σενάρια, καθώς και κινέζικα . Το OCR API επεξεργάζεται σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης, περιοχές εικόνων και σαρωμένα PDF και επιστρέφει αποτελέσματα στις πιο δημοφιλείς μορφές εγγράφων. Η ταχύτητα αναγνώρισης, η ακρίβεια και η απόδοση μπορούν να βελτιωθούν περαιτέρω κατανέμοντας τον υπολογισμό σε πολλούς πυρήνες CPU και εκφορτώνοντας εργασίες έντασης πόρων στη GPU .
Χαρακτηριστικά και δυνατότητες του Aspose.OCR για Java
Αναγνωρίζει μορφοποιημένο κείμενο σε σαρωμένες εικόνες και αρχεία PDF
Υποστηρίζει όλες τις μορφές αρχείων που μπορείτε να λάβετε από σαρωτή ή κάμερα
Διαβάζει λατινική και κυριλλική γραφή
Αναγνωρίζει περισσότερους από 6.000 κινεζικούς χαρακτήρες
Εντοπίζει και αναγνωρίζει όλες τις δημοφιλείς γραμματοσειρές
Διατηρεί προσεκτικά τα στυλ γραμματοσειράς και τη μορφοποίηση
Επεξεργάζεται μόνο ολόκληρη την εικόνα ή επιλεγμένες περιοχές
Υποστηρίζει περιστρεφόμενες, λοξές και θορυβώδεις εικόνες
Μαζική αναγνώριση όλων των εικόνων σε φάκελο ή αρχείο
Αναγνωρίζει τις εικόνες που παρέχονται ως συνδέσμους Ιστού
Βρίσκει και διορθώνει αυτόματα τις ανορθόγραφες λέξεις
100% συμβατότητα με άλλα προϊόντα Aspose
Εύκολο στην εγκατάσταση
Μπορείτε να χρησιμοποιήσετε το Aspose.OCR για Java απευθείας από ένα έργο που βασίζεται στο Maven ακολουθώντας απλές οδηγίες εγκατάστασης .
Ζητήστε μια προσωρινή άδεια για να ξεκινήσετε τη δημιουργία μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς και περιορισμούς.
$Easy to Use$
Η αναγνώριση εικόνας απαιτεί μερικές γραμμές κώδικα. Κυριολεκτικά. Είναι πραγματικά τόσο απλό - δοκιμάστε μόνοι σας:
Εικόνα σε κείμενο σε 7 γραμμές - Java
// Δημιουργία παρουσίας OCR API
AsposeOCR api = new AsposeOCR();
try {
// Αναγνώριση εικόνας
String result = api.RecognizePage(imagePath);
// Εμφάνιση του αποτελέσματος αναγνώρισης
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// Διαχείριση σφαλμάτων
e.printStackTrace();
}
26 Γλώσσες αναγνώρισης
Το OCR API υποστηρίζει μεγάλο αριθμό γλωσσών και όλα τα δημοφιλή σενάρια γραφής, συμπεριλαμβανομένων κειμένων με μεικτές γλώσσες. Ο ενσωματωμένος ορθογραφικός έλεγχος αντικαθιστά αυτόματα τις ανορθόγραφες λέξεις και σας γλιτώνει από τον κόπο της μη αυτόματης διόρθωσης των αποτελεσμάτων αναγνώρισης.
- Εκτεταμένο λατινικό αλφάβητο : Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
- Κυριλλικό αλφάβητο : Λευκορωσικό, Βουλγαρικό, Καζακστάν, Ρωσικό, Σερβικό, Ουκρανικό.
- Κινέζικα : περισσότεροι από 6.000 χαρακτήρες.
Μπορείτε να καθορίσετε τη γλώσσα για να αυξήσετε την απόδοση και την αξιοπιστία αναγνώρισης ή να αφήσετε το API να ανιχνεύει αυτόματα γλώσσες.
Διατήρηση μορφοποίησης
Το OCR API διαβάζει όλες τις δημοφιλείς γραμματοσειρές όπως Arial, Times New Roman, Courier New, Tahoma, Calibri και άλλα σε κανονικά, έντονα και πλάγια στυλ και διατηρεί προσεκτικά τη μορφοποίηση στα αποτελέσματα OCR. Μπορείτε επίσης να χωρίσετε τα αποτελέσματα αναγνώρισης σε γραμμές και να εντοπίσετε περιοχές κειμένου σε μια σελίδα.
Αναγνώριση φωτογραφιών
Ο σαρωτής δεν είναι πάντα διαθέσιμος σε σταθμούς εργασίας τελικού χρήστη, ο οποίος μπορεί να γίνει επίδειξη για εφαρμογές OCR. Το OCR API παρέχει μια σειρά από φίλτρα προεπεξεργασίας που μπορούν να χειριστούν παραμορφωμένες, περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Σε συνδυασμό με την υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει την αξιόπιστη αναγνώριση ακόμη και φωτογραφιών smartphone. Το μεγαλύτερο μέρος της προεπεξεργασίας και της διόρθωσης εικόνας γίνεται αυτόματα, αλλά μπορείτε πάντα να επέμβετε σε δύσκολες περιπτώσεις.
Εφαρμογή διορθώσεων εικόνας - Java
// Δημιουργία παρουσίας OCR API
AsposeOCR api = new AsposeOCR();
// Ορίστε φίλτρα προεπεξεργασίας
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Προεπεξεργασία εικόνας πριν από την αναγνώριση
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Αναγνώριση εικόνας
RecognitionResult result = api.RecognizePage(imageRes, set);
Βελτιστοποίηση απόδοσης
Η οπτική αναγνώριση χαρακτήρων απαιτεί πολλούς πόρους επεξεργασίας, οι οποίοι μπορεί να αποτελέσουν πρόβλημα για υπηρεσίες web και συσκευές εισαγωγικού επιπέδου. Το API προσφέρει πολύ ευέλικτους τρόπους εξισορρόπησης της ταχύτητας αναγνώρισης, των απαιτήσεων πόρων και της ακρίβειας:
- Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
- Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων της CPU.
- Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στη GPU.
Γρήγορη αναγνώριση - Java
// Δημιουργία παρουσίας OCR API
AsposeOCR api = new AsposeOCR();
// Αναγνώριση εικόνας στην ταχύτερη λειτουργία
String result = api.RecognizePageFast("sample.jpg");
Επεξεργασία παρτίδων
Το OCR API σάς απαλλάσσει από το να χρειάζεται να αναγνωρίζετε κάθε εικόνα μία-μία, προσφέροντας διάφορες μεθόδους επεξεργασίας κατά παρτίδες που σας επιτρέπουν να αναγνωρίζετε πολλές εικόνες σε μία μόνο κλήση:
- Αναγνώριση πολυσέλιδων αρχείων PDF και TIFF.
- Αναγνώριση όλων των αρχείων σε ένα αρχείο.
- Αναγνώριση όλων των αρχείων σε ένα φάκελο.
Support and Learning Resources
- Υποστήριξη προιόντος
- Δωρεάν Υποστήριξη
- Υποστήριξη επί πληρωμή
- Ιστολόγιο
- Σημειώσεις έκδοσης
- Γιατί το Aspose.OCR για Java;
- Λίστα Πελατών
- Ιστορίες επιτυχίας