Μετατροπή εικόνας σε κείμενο με το Python OCR API μέσω Java
Αναγνώριση κειμένου σε εικόνες με Python
Περισσότερες προθήκες ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Γιατί το Aspose.OCR για Python μέσω Java;
Το Aspose.OCR για Python μέσω Java ενσωματώνει απρόσκοπτα τις ισχυρές δυνατότητες οπτικής αναγνώρισης χαρακτήρων (OCR) στους φορητούς υπολογιστές και τις εφαρμογές Python που διαθέτετε μεταξύ πλατφορμών. Με το διαισθητικό και υψηλής ταχύτητας API μας, μπορείτε να εξαγάγετε αβίαστα κείμενο από σαρώσεις, στιγμιότυπα οθόνης, συνδέσμους ιστού ή φωτογραφίες smartphone, παρέχοντας αποτελέσματα που είναι έτοιμα για ενοποίηση, ανάλυση ή αποθήκευση. Αναγνωρίστε σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης και σαρωμένα αρχεία PDF, αποθηκεύοντας αποτελέσματα σε δημοφιλείς μορφές εγγράφων. Τα προηγμένα φίλτρα προεπεξεργασίας χειρίζονται περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Βελτιστοποιήστε την απόδοση μεταφορτώνοντας εργασίες στη GPU.
Γρήγορη και ακριβή OCR
Επιτύχετε υψηλής ταχύτητας και ακριβή αποτελέσματα OCR με την προηγμένη Python μας μέσω τεχνολογίας Java.
Πολυγλωσσική Υποστήριξη
Αναγνωρίστε κείμενο σε 130+ γλώσσες, συμπεριλαμβανομένων λατινικών, κυριλλικών, αραβικών, περσικών, ινδικών και κινεζικών σεναρίων, διασφαλίζοντας ευελιξία για τις εφαρμογές σας Python μέσω Java.
Ευέλικτη υποστήριξη εικόνας
Επεξεργαστείτε εικόνες από σαρωτές, κάμερες και smartphone απρόσκοπτα με Python μέσω Java.
Ακρίβεια στην αναγνώριση κινεζικών χαρακτήρων
Αναγνωρίστε πάνω από 6.000 κινεζικούς χαρακτήρες με ακρίβεια στα έργα Python σας μέσω Java.
Διατηρήστε τα στυλ γραμματοσειράς και τη μορφοποίηση
Διατηρήστε στυλ γραμματοσειράς και μορφοποίηση για ακριβή αναπαράσταση αναγνωρισμένου κειμένου στις εφαρμογές Python σας μέσω Java.
Ζωντανό δείγμα κώδικα
Ξεκινήστε την αναγνώριση κειμένου από εικόνες σε τρεις μόνο γραμμές κώδικα. Ζήστε την απλότητα!
* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Όροι χρήσης και Πολιτική Απορρήτου.
Μετατροπή εικόνας σε κείμενο
Περισσότερα παραδείγματα ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Επιλέξτε την προτίμησή σας
Επιλέξτε τη σωστή βιβλιοθήκη για τις ανάγκες σας. Εξερευνήστε τα διαθέσιμα API και τις δυνατότητές τους για να επιλέξετε την πιο αποτελεσματική λύση.
Ευστροφία
Python via .NET
Ομοιομορφία
Python via Java
Εκτέλεση
Python via C++
Συμβατότητα Java Backend
Σχεδιασμένη ως λειτουργική μονάδα Python, η βιβλιοθήκη μας εξασφαλίζει συμβατότητα με τα κύρια λειτουργικά συστήματα που υποστηρίζουν Java - συμπεριλαμβανομένων των Microsoft Windows, Linux και macOS ή πλατφόρμες cloud. Αυτό σας δίνει τη δυνατότητα να αναπτύξετε εφαρμογές σε μια πλατφόρμα και να τις εκτελείτε απρόσκοπτα σε μια άλλη, εξαλείφοντας την ανάγκη για τυχόν τροποποιήσεις κώδικα.
Υποστηριζόμενες μορφές αρχείων
Aspose.OCR for Python via Java μπορεί να λειτουργήσει με οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.
εικόνες
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Παρτίδα OCR
- Multi-page PDF
- ZIP
- Folder
Αποτελέσματα αναγνώρισης
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Εύκολη εγκατάσταση για Python μέσω Java
Το Aspose.OCR για Python μέσω Java παραδίδεται ως πακέτο Python ή ως αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις. εγκαταστήστε εύκολα στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε πολλές υποστηριζόμενες γλώσσες και να αποθηκεύσετε αποτελέσματα αναγνώρισης σε διάφορες μορφές.
Ζητήστε μια δοκιμαστική άδεια για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.
Ισχυρό OCR για εφαρμογές Python
Η βιβλιοθήκη μας ενσωματώνεται εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται απρόσκοπτα σε οποιαδήποτε πλατφόρμα – επιτραπέζιους υπολογιστές Windows, Windows Server, macOS, Linux και cloud.
130+ Γλώσσες Αναγνώρισης
Το Python και το Java OCR API μας αναγνωρίζει μια πληθώρα γλωσσών και δημοφιλών σεναρίων γραφής, συμπεριλαμβανομένων μικτών γλωσσών:
Αφήστε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή ορίστε τη γλώσσα μόνοι σας για βελτιωμένη απόδοση αναγνώρισης και αξιοπιστία.
- Εκτεταμένο λατινικό αλφάβητο: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
- Κυριλλικό αλφάβητο: Ρώσικα, Ουκρανικά, Καζακικά, Σερβικά, Λευκορωσικά, Βουλγαρικά.
- Αραβικά, Περσικά, Ουρντού;
- Κινεζική και γραφή Devanagari, συμπεριλαμβανομένων των Χίντι, Μαράθι, Μποτζπουρί και άλλων.
Βελτιωμένα φίλτρα επεξεργασίας εικόνας
Η ακρίβεια της οπτικής αναγνώρισης χαρακτήρων βασίζεται σε μεγάλο βαθμό στην ποιότητα της αρχικής εικόνας. Το Aspose.OCR για Python μέσω Java προσφέρει ένα ευρύ φάσμα αυτοματοποιημένων και μη αυτόματων φίλτρων επεξεργασίας εικόνας για τη βελτιστοποίηση μιας εικόνας πριν από την υποβολή στη μηχανή OCR:
- Αυτόματη ευθυγράμμιση εικόνων με ελαφρά κλίση.
- Διορθώστε χειροκίνητα την περιστροφή των πολύ λοξών εικόνων.
- Αφαιρέστε αυτόματα τη βρωμιά, τις κηλίδες, τις γρατσουνιές, τη λάμψη, τις ανεπιθύμητες κλίσεις και άλλους τύπους θορύβου.
- Προσαρμόστε αυτόματα την αντίθεση της εικόνας.
- Αυτόματη αναβάθμιση ή μη αυτόματη αλλαγή μεγέθους της εικόνας.
- Μετατροπή εικόνων σε ασπρόμαυρες ή σε κλίμακα του γκρι.
- Αντιστρέψτε τα χρώματα της εικόνας, κάνοντας τις φωτεινές περιοχές να φαίνονται σκοτεινές και οι σκοτεινές περιοχές να φαίνονται ανοιχτές.
- Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
- Θολώστε τις θορυβώδεις εικόνες διατηρώντας τις άκρες των γραμμάτων.
- Ισιώστε τη λοξή σελίδα και διορθώστε την παραμόρφωση του φακού της κάμερας στις φωτογραφίες της σελίδας.
Εξειδικευμένα API για διάφορους τύπους εγγράφων
Το Aspose.OCR για Python μέσω Java προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:
- Σαρωμένα ή φωτογραφημένα δελτία ταυτότητας και διαβατήρια.
- Πινακίδες κυκλοφορίας οχημάτων.
- τιμολόγια.
- Αποδείξεις.
Ενσωματωμένος ορθογραφικός έλεγχος
Παρόλο που το Aspose.OCR για Python μέσω Java παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυπικές γραμματοσειρές ενδέχεται να προκαλέσουν εσφαλμένη αναγνώριση ορισμένων χαρακτήρων ή λέξεων. Για περαιτέρω βελτίωση των αποτελεσμάτων αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα τα ορθογραφικά λάθη με βάση την επιλεγμένη γλώσσα αναγνώρισης.
Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντμήσεις και άλλες λέξεις που δεν υπάρχουν σε κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.
Αποτελεσματική αναγνώριση παρτίδων
Το Python OCR API σας δίνει τη δυνατότητα να βελτιστοποιήσετε την αναγνώριση εικόνων. Χρησιμοποιήστε ευέλικτες μεθόδους μαζικής επεξεργασίας για αποτελεσματική επεξεργασία πολλαπλών εικόνων σε μία μόνο κλήση:
- Αναγνώριση πολυσέλιδων αρχείων PDF, TIFF.
- Επεξεργαστείτε όλα τα αρχεία σε έναν φάκελο.
- Χειριστείτε την αναγνώριση για όλα τα αρχεία σε ένα αρχείο.
- Αναγνώριση εικόνων από μια καθορισμένη λίστα.
Εκμάθηση μέσω Παραδειγμάτων Python
Εξερευνήστε μια ποικιλία από παραδείγματα Python που έχουν σχεδιαστεί για να σας βοηθήσουν να κατανοήσετε γρήγορα τις λειτουργίες και τις δυνατότητες της λύσης OCR μας. Αποκτήστε γρήγορα πληροφορίες για τη δημιουργία προσαρμοσμένων λύσεων που ανταποκρίνονται στις συγκεκριμένες απαιτήσεις της επιχείρησής σας.
Χαρακτηριστικά και Δυνατότητες
Aspose.OCR for Python via Java Εξερευνήστε τις προηγμένες δυνατότητες του Aspose.OCR για Python
Φωτογραφία OCR
Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.
PDF με δυνατότητα αναζήτησης
Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.
Αναγνώριση URL
Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.
Μαζική αναγνώριση
Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.
Οποιαδήποτε γραμματοσειρά και στυλ
Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.
Αναγνώριση με ακρίβεια
Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.
Ορθογραφικός έλεγχος
Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.
Βρείτε κείμενο σε εικόνες
Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.
Συγκρίνετε κείμενα εικόνων
Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.
Δείγματα κώδικα Python
Ανακαλύψτε δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το Aspose.OCR για Python μέσω Java στις εφαρμογές σας.
Αβίαστη Εγκατάσταση
Ως πακέτο Python ή αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις, το Aspose.OCR για Python μέσω Java εξασφαλίζει εύκολη διανομή. Ενσωματώστε το στο έργο σας απευθείας από την Python και είστε έτοιμοι να αξιοποιήσετε πλήρεις δυνατότητες OCR, αποθηκεύοντας αποτελέσματα αναγνώρισης σε διάφορες μορφές.
Μετά την εγκατάσταση, ξεκινήστε αμέσως τη χρήση του Aspose.OCR για Python μέσω Java, αν και με ορισμένους περιορισμούς. Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, η οποία σας επιτρέπει να λάβετε μια τεκμηριωμένη απόφαση σχετικά με την αγορά του Aspose.OCR για Python μέσω Java αργότερα.
Φόρτωση άδειας
lic = License()
lic.set_license(self.licPath)
Αναγνώριση εικόνας
Η κύρια πρόκληση στις εφαρμογές OCR είναι η έλλειψη σαρωτών για τους τελικούς χρήστες. Το API μας, που ενσωματώνεται απρόσκοπτα με την Python μέσω Java, διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνας που χειρίζονται περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Σε συνδυασμό με υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει αξιόπιστη αναγνώριση, ακόμη και από φωτογραφίες smartphone. Οι περισσότερες προεπεξεργασίες και διόρθωση εικόνας είναι αυτοματοποιημένες, απαιτώντας την παρέμβασή σας μόνο σε δύσκολες περιπτώσεις.
Εφαρμογή αυτόματων διορθώσεων εικόνας - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Το API μας διαβάζει επιδέξια οποιαδήποτε εικόνα από σαρωτές, κάμερες ή smartphone: έγγραφα PDF, αρχεία JPEG, PNG, TIFF, GIF, BMP. Η πλήρης υποστήριξη για έγγραφα PDF πολλών σελίδων, εικόνες TIFF και DjVu εξασφαλίζει ευελιξία. Μπορείτε επίσης να παρέχετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.
Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.
Αναγνώριση PDF και αποθήκευση αποτελεσμάτων σε διάφορες μορφές εξόδου - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Βελτιστοποίηση χρήσης πόρων
Το OCR προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης για την εξαγωγή περιεχομένου από εικόνες με αραιό κείμενο και θορυβώδες/έγχρωμο φόντο. Αυτή η μέθοδος βελτιώνει σημαντικά την ακρίβεια OCR στις ακόλουθες επιχειρηματικές περιπτώσεις:
- Διαβάστε κείμενο από φωτογραφίες δρόμου.
- Τμηματοποιήστε και αναγνωρίστε οδικές πινακίδες και πινακίδες εντός εικόνων δρόμου.
- Εντοπίστε ετικέτες τιμών και ερμηνεύστε το εξαγόμενο κείμενο ως τιμές.
- Βρείτε και συγκεντρώστε περιοχές ενδιαφέροντος στις ετικέτες τροφίμων, όπως διατροφικές πληροφορίες ή λίστες συστατικών.
- Αναγνώριση και ανάλυση πινακίδων κυκλοφορίας αυτοκινήτων.
- Εξαγωγή κειμένου από μενού και καταλόγους.
Ανοιχτή περιοχή OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Εξαγωγή κειμένου από φωτογραφίες δρόμου
Το OCR for Python προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης που εξάγει κείμενο από πινακίδες κυκλοφορίας οχημάτων, συμπεριλαμβανομένων σκοτεινών και θολών φωτογραφιών. Το κείμενο που προκύπτει μπορεί στη συνέχεια να αποθηκευτεί αυτόματα στη βάση δεδομένων ή να επαληθευτεί αυτόματα.
Αναγνώριση αριθμού αυτοκινήτου - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)