Μετατρέψτε την εικόνα σε κείμενο με API Python OCR μέσω Java
Αναγνωρίστε το κείμενο σε εικόνες με Python
Περισσότερες βιτρίνες ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Γιατί το Aspose.ocr για την Python μέσω της Java;
Το Aspose.ocr για την Python μέσω της Java ενσωματώνει απρόσκοπτα τις δυνατότητες ισχυρών οπτικών αναγνώρισης χαρακτήρων (OCR) στα σημειωματάρια και εφαρμογές Python Cross-Platform Python. Με το διαισθητικό και υψηλής ταχύτητας API, μπορείτε να εξαγάγετε αβίαστα κείμενο από σαρώσεις, στιγμιότυπα οθόνης, συνδέσμους ιστού ή φωτογραφίες smartphone, παρέχοντας αποτελέσματα που είναι έτοιμα για ενοποίηση, ανάλυση ή αποθήκευση. Αναγνωρίστε τις σαρωμένες εικόνες, τις φωτογραφίες smartphone, τα στιγμιότυπα οθόνης και τα σαρωμένα PDFs, η εξοικονόμηση αποτελεσμάτων σε δημοφιλείς μορφές εγγράφων. Τα προχωρημένα φίλτρα προ-επεξεργασίας χειρίζονται περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Βελτιστοποιήστε τις επιδόσεις με την εκφόρτωση εργασιών στη GPU.

Swift και ακριβές OCR
Επιτύχετε υψηλής ταχύτητας και ακριβή αποτελέσματα OCR με την προηγμένη Python μέσω της τεχνολογίας Java.
Πολύγλωσσος υποστήριξη
Αναγνωρίστε το κείμενο σε 140+ γλώσσες, συμπεριλαμβανομένων των λατινικών, κυριλλικών, αραβικών, περσικών, ενδείξεων και κινεζικών σεναρίων, εξασφαλίζοντας την ευελιξία για τις εφαρμογές Python μέσω της Java.
Ευέλικτη υποστήριξη εικόνας
Επεξεργαστείτε εικόνες από σαρωτές, κάμερες και smartphones άψογα με την Python μέσω Java.
Ακρίβεια στην κινεζική αναγνώριση χαρακτήρων
Αναγνωρίστε πάνω από 6.000 κινέζους χαρακτήρες με ακρίβεια στα έργα σας στο Python μέσω της Java.
Διατηρήστε στυλ γραμματοσειράς και μορφοποίηση
Διατηρήστε στυλ γραμματοσειράς και μορφοποίηση για ακριβή αναπαράσταση αναγνωρισμένου κειμένου στις εφαρμογές Python μέσω της Java.
Δείγμα ζωντανού κώδικα
Ξεκινήστε την αναγνώριση κειμένου από εικόνες σε μόλις τρεις γραμμές κώδικα. Ζήστε την απλότητα!
* Μεταφορτώντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία που συμφωνείτε με το δικό μας Όροι χρήσης και Πολιτική απορρήτου.
Μετατρέψτε την εικόνα σε κείμενο
Περισσότερα παραδείγματα ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Επιλέξτε την προτίμησή σας
Επιλέξτε τη σωστή βιβλιοθήκη για τις ανάγκες σας. Εξερευνήστε τα διαθέσιμα API και τις δυνατότητές τους για να επιλέξετε την πιο αποτελεσματική λύση.
Ευστροφία
Python via .NET
Ομοιομορφία
Python via Java
Εκτέλεση
Python via C++
Συμβατότητα Java Backend
Σχεδιασμένο ως μονάδα Python, η βιβλιοθήκη μας εξασφαλίζει τη συμβατότητα σε σημαντικά λειτουργικά συστήματα που υποστηρίζουν Java Αυτό σας δίνει τη δυνατότητα να αναπτύξετε εφαρμογές σε μία πλατφόρμα και να τις εκτελέσετε απρόσκοπτα σε άλλη, εξαλείφοντας την ανάγκη για τροποποιήσεις κώδικα.
Υποστηριζόμενες μορφές αρχείων
Aspose.OCR for Python via Java μπορεί να λειτουργήσει με οποιοδήποτε αρχείο Μπορείτε να πάρετε από σαρωτή ή κάμερα. Τα αποτελέσματα της αναγνώρισης μπορούν να αποθηκευτούν, να εισάγονται σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.
Εικόνες
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Παρτίδα OCR
- Multi-page PDF
- ZIP
- Folder
Αποτελέσματα αναγνώρισης
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Αβίαστη εγκατάσταση για την Python μέσω Java
Το Aspose.ocr για την Python μέσω Java παραδίδεται ως πακέτο Python ή ως αρχείο που μπορεί να κατεβάσει με ελάχιστες εξαρτήσεις. Εύκολα εγκατάσταση αυτό στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε πολλαπλές υποστηριζόμενες γλώσσες και να αποθηκεύσετε την αναγνώριση σε διάφορες μορφές.
Ζητήστε άδεια δοκιμής για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.
Ισχυρό OCR για εφαρμογές Python
Η βιβλιοθήκη μας ενσωματώνει εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται άψογα σε οποιαδήποτε πλατφόρμα - επιτραπέζια παράθυρα, Windows Server, MacOS, Linux και το σύννεφο.
140+ γλώσσες αναγνώρισης
Το API Python και Java OCR αναγνωρίζει μια πληθώρα γλωσσών και δημοφιλών σεναρίων γραφής, συμπεριλαμβανομένων μικτών γλωσσών:
Αφήστε την ανίχνευση γλωσσών στη βιβλιοθήκη ή καθορίστε τη γλώσσα μόνοι σας για βελτιωμένη απόδοση και αξιοπιστία αναγνώρισης.
- ** Extended Latin ** Αλφάβητο: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
- ** Κυριλλικό ** Αλφάβητο: Ρωσικά, Ουκρανικά, Καζακ, Σερβικά, Λευκορωσιά, Βουλγαρικά.
- Αραβικά, Περσικά, Ουρντού.
- Κινέζικα και Devanagari σενάριο, συμπεριλαμβανομένων των Χίντι, Μαράθι, Bhojpuri και άλλων.
Ενισχυμένα φίλτρα επεξεργασίας εικόνας
Η ακρίβεια της αναγνώρισης οπτικού χαρακτήρα βασίζεται σε μεγάλο βαθμό στην ποιότητα της αρχικής εικόνας. Το Aspose.ocr για την Python μέσω Java προσφέρει ένα ευρύ φάσμα τόσο αυτοματοποιημένων όσο και χειροκίνητων φίλτρων επεξεργασίας εικόνας για να βελτιστοποιήσει μια εικόνα πριν από την υποβολή στον κινητήρα OCR:
- Αυτόματη ισορροπία ελαφρώς κλίση εικόνων.
- Διορθώστε με μη αυτόματο τρόπο την περιστροφή των αυστηρών λοξών εικόνων.
- Αφαιρέστε αυτόματα τη βρωμιά, τις κηλίδες, τις γρατζουνιές, την αντανάκλαση, τις ανεπιθύμητες κλίσεις και άλλους τύπους θορύβου.
- Ρυθμίστε αυτόματα την αντίθεση της εικόνας.
- Αυτόματα αναβαθμισμένα ή χειροκίνητα το μέγεθος της εικόνας.
- Μετατρέψτε τις εικόνες σε ασπρόμαυρο ή σε κλίμακα του γκρι.
- Αναστροφή χρώματα εικόνας, κάνοντας τις περιοχές φωτός να εμφανίζονται σκοτεινές και σκοτεινές περιοχές να φαίνονται ελαφριά.
- Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
- Θορυβώδεις εικόνες θορυβώδους, διατηρώντας τα άκρα των επιστολών.
- Ισιώστε τη σελίδα και τη σωστή παραμόρφωση του φακού της κάμερας στις φωτογραφίες της σελίδας.
Ειδικά API για διάφορους τύπους εγγράφων
Το Aspose.ocr για την Python μέσω της Java προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:
- Σαρωμένες ή φωτογραφικές δεξαμενές ταυτότητας και διαβατήρια.
- Πινακίδες κυκλοφορίας οχημάτων.
- Τιμολόγια.
- Αποδείξεις.
Ενσωματωμένος ορθογραφικός έλεγχος
Παρόλο που το ASPOSE.OCR για την Python μέσω Java παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυποποιημένες γραμματοσειρές μπορεί να προκαλέσουν εσφαλμένα ορισμένους χαρακτήρες ή λέξεις. Για να βελτιώσετε περαιτέρω τα αποτελέσματα αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα ορθογραφικά σφάλματα με βάση την επιλεγμένη γλώσσα αναγνώρισης.
Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντομογραφίες και άλλες λέξεις που δεν υπάρχουν σε κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.
Αποτελεσματική αναγνώριση παρτίδας
Το API Python OCR σας δίνει τη δυνατότητα να εξορθολογίσετε την αναγνώριση εικόνας. Χρησιμοποιήστε τις ευέλικτες μεθόδους επεξεργασίας παρτίδας για την αποτελεσματική επεξεργασία πολλαπλών εικόνων σε μία μόνο κλήση:
- Αναγνωρίστε τα αρχεία PDF πολλαπλών σελίδων, TIFF.
- Επεξεργαστείτε όλα τα αρχεία μέσα σε ένα φάκελο.
- Χειριστείτε την αναγνώριση για όλα τα αρχεία σε ένα αρχείο.
- Αναγνωρίστε εικόνες από μια συγκεκριμένη λίστα.
Μαθαίνοντας μέσω παραδείγματα Python
Εξερευνήστε μια ποικιλία από παραδείγματα Python που έχει σχεδιαστεί για να σας βοηθήσει να κατανοήσετε γρήγορα τις λειτουργίες και τις δυνατότητες της λύσης OCR μας. Κερδίστε γρήγορα τη δημιουργία προσαρμοσμένων λύσεων που πληρούν τις συγκεκριμένες επιχειρηματικές σας απαιτήσεις.
Χαρακτηριστικά και δυνατότητες
Aspose.OCR for Python via Java Εξερευνήστε τα προηγμένα χαρακτηριστικά του ASPOSE.OCR για Python
Φωτογραφία OCR
Εξαγάγετε κείμενο από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.
Pdf που μπορεί να αναζητηθεί
Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.
Αναγνώριση διεύθυνσης URL
Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.
Αναγνώριση χύδην
Διαβάστε όλες τις εικόνες από έγγραφα πολλαπλών σελίδων, φακέλους και αρχεία.
Οποιαδήποτε γραμματοσειρά και στυλ
Προσδιορίστε και αναγνωρίζετε το κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.
Αναγνώριση τελειοποίησης
Ρυθμίστε κάθε παράμετρο OCR για τα καλύτερα αποτελέσματα αναγνώρισης.
Ορθογραφικός έλεγχος
Βελτιώστε τα αποτελέσματα με αυτόματα τη διόρθωση των ορθογραφικών λέξεων.
Βρείτε κείμενο σε εικόνες
Αναζητήστε κείμενο ή κανονική έκφραση μέσα σε ένα σύνολο εικόνων.
Συγκρίνετε κείμενα εικόνας
Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.
Δείγματα κώδικα Python
Ανακαλύψτε τα δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το ASPOSE.OCR για την Python μέσω της Java στις εφαρμογές σας.
Αβίαστη εγκατάσταση
Ως πακέτο Python ή ένα αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις, το ASPOSE.OCR για την Python μέσω της Java εξασφαλίζει εύκολη διανομή. Ενσωματώστε το στο έργο σας απευθείας από την Python και είστε διατεθειμένοι να αξιοποιήσετε πλήρεις δυνατότητες OCR, η εξοικονόμηση αναγνώρισης έχει ως αποτέλεσμα διάφορες μορφές. Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, επιτρέποντάς σας να λάβετε τεκμηριωμένη απόφαση σχετικά με την αγορά ASPOSE.OCR για την Python μέσω της Java αργότερα.
Άδεια φόρτωσης
lic = License()
lic.set_license(self.licPath)
Αναγνώριση εικόνας
Η κύρια πρόκληση στις εφαρμογές OCR είναι η έλλειψη σαρωτών για τους τελικούς χρήστες. Το API μας, ενσωματωμένο απρόσκοπτα με την Python μέσω της Java, διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνων που χειρίζονται περιστρεφόμενα, λοξά και θορυβώδεις εικόνες. Σε συνδυασμό με την υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει αξιόπιστη αναγνώριση, ακόμη και από φωτογραφίες smartphone. Οι περισσότερες προ-επεξεργασία και διόρθωση εικόνας είναι αυτοματοποιημένες, απαιτώντας την παρέμβασή σας μόνο σε προκλητικές περιπτώσεις.
Εφαρμόστε αυτόματες διορθώσεις εικόνας - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Το API μας διαβάζει δεξιότητα οποιασδήποτε εικόνας από σαρωτές, κάμερες ή smartphones: έγγραφα PDF, JPEG, PNG, TIFF, GIF, BMP αρχεία. Η πλήρης υποστήριξη για τα έγγραφα πολλαπλών σελίδων PDF, οι εικόνες TIFF και DJVU εξασφαλίζουν την ευελιξία. Μπορείτε επίσης να δώσετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.
Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.
Αναγνωρίστε το PDF και αποθηκεύστε τα αποτελέσματα σε διάφορες μορφές εξόδου - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Βελτιστοποίηση της χρήσης πόρων
Το OCR προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης για την εξαγωγή περιεχομένου από εικόνες με αραιό κείμενο και θορυβώδη/έγχρωμο φόντο. Αυτή η μέθοδος βελτιώνει σημαντικά την ακρίβεια OCR στις ακόλουθες επιχειρηματικές περιπτώσεις:
- Διαβάστε το κείμενο από τις φωτογραφίες του δρόμου.
- Τμήμα και εντοπισμός οδικών πινακίδων και πινακίδων εντός εικόνων δρόμου.
- Εντοπίστε τις ετικέτες τιμών και ερμηνεύστε το εξαγόμενο κείμενο ως τιμές.
- Βρείτε και συνολικές περιοχές ενδιαφέροντος στις ετικέτες τροφίμων, όπως διατροφικές πληροφορίες ή λίστες συστατικών.
- Προσδιορίστε και αναλύστε τις πινακίδες κυκλοφορίας αυτοκινήτων.
- Εξαγάγετε κείμενο από μενού και καταλόγους.
Ανοιχτή περιοχή OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Εξαγωγή κειμένου από φωτογραφίες δρόμου
Το OCR για την Python προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης που εξάγει κείμενο από πινακίδες κυκλοφορίας οχημάτων, συμπεριλαμβανομένων των σκοτεινών και θολών φωτογραφιών. Το προκύπτον κείμενο μπορεί στη συνέχεια να αποθηκευτεί αυτόματα στη βάση δεδομένων ή να επαληθευτεί αυτόματα.
Αναγνωρίστε τον αριθμό αυτοκινήτου - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)