Γιατί το Aspose.ocr για την Python μέσω της Java;

Το Aspose.ocr για την Python μέσω της Java ενσωματώνει απρόσκοπτα τις δυνατότητες ισχυρών οπτικών αναγνώρισης χαρακτήρων (OCR) στα σημειωματάρια και εφαρμογές Python Cross-Platform Python. Με το διαισθητικό και υψηλής ταχύτητας API, μπορείτε να εξαγάγετε αβίαστα κείμενο από σαρώσεις, στιγμιότυπα οθόνης, συνδέσμους ιστού ή φωτογραφίες smartphone, παρέχοντας αποτελέσματα που είναι έτοιμα για ενοποίηση, ανάλυση ή αποθήκευση. Αναγνωρίστε τις σαρωμένες εικόνες, τις φωτογραφίες smartphone, τα στιγμιότυπα οθόνης και τα σαρωμένα PDFs, η εξοικονόμηση αποτελεσμάτων σε δημοφιλείς μορφές εγγράφων. Τα προχωρημένα φίλτρα προ-επεξεργασίας χειρίζονται περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Βελτιστοποιήστε τις επιδόσεις με την εκφόρτωση εργασιών στη GPU.

Illustration ocr

Swift και ακριβές OCR

Επιτύχετε υψηλής ταχύτητας και ακριβή αποτελέσματα OCR με την προηγμένη Python μέσω της τεχνολογίας Java.

Πολύγλωσσος υποστήριξη

Αναγνωρίστε το κείμενο σε 140+ γλώσσες, συμπεριλαμβανομένων των λατινικών, κυριλλικών, αραβικών, περσικών, ενδείξεων και κινεζικών σεναρίων, εξασφαλίζοντας την ευελιξία για τις εφαρμογές Python μέσω της Java.

Ευέλικτη υποστήριξη εικόνας

Επεξεργαστείτε εικόνες από σαρωτές, κάμερες και smartphones άψογα με την Python μέσω Java.

Ακρίβεια στην κινεζική αναγνώριση χαρακτήρων

Αναγνωρίστε πάνω από 6.000 κινέζους χαρακτήρες με ακρίβεια στα έργα σας στο Python μέσω της Java.

Διατηρήστε στυλ γραμματοσειράς και μορφοποίηση

Διατηρήστε στυλ γραμματοσειράς και μορφοποίηση για ακριβή αναπαράσταση αναγνωρισμένου κειμένου στις εφαρμογές Python μέσω της Java.

Δείγμα ζωντανού κώδικα

Ξεκινήστε την αναγνώριση κειμένου από εικόνες σε μόλις τρεις γραμμές κώδικα. Ζήστε την απλότητα!

Έτοιμος να αναγνωρίσει Έτοιμος να αναγνωρίσει Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε *

* Μεταφορτώντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία που συμφωνείτε με το δικό μας Όροι χρήσης και Πολιτική απορρήτου.

Αποτέλεσμα αναγνώρισης
 

Μετατρέψτε την εικόνα σε κείμενο

Περισσότερα παραδείγματα >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Επιλέξτε την προτίμησή σας

Επιλέξτε τη σωστή βιβλιοθήκη για τις ανάγκες σας. Εξερευνήστε τα διαθέσιμα API και τις δυνατότητές τους για να επιλέξετε την πιο αποτελεσματική λύση.

Ευστροφία

Python via .NET

Εύκολη ανάπτυξη, αναγνωσιμότητα και διατήρηση του κώδικα
Διαθέτει τα περισσότερα χαρακτηριστικά και λαμβάνει τις πιο συχνές ενημερώσεις
Η συνολική ταχύτητα μπορεί να είναι λίγο πιο αργή από άλλες πλατφόρμες

Ομοιομορφία

Python via Java

Χρησιμοποιήστε την ίδια βιβλιοθήκη σε οποιαδήποτε πλατφόρμα
Εκτελέστε απρόσκοπτα την αίτησή σας σε οποιαδήποτε συσκευή
Απαιτεί το Java Runtime Environment (JRE) Έκδοση 8 ή αργότερα

Εκτέλεση

Python via C++

Την ταχύτερη δυνατή ταχύτητα ανεξάρτητα από την πλατφόρμα
Πολύς έλεγχος της διαχείρισης των πόρων
Στοχεύει σε έμπειρους προγραμματιστές

Συμβατότητα Java Backend

Σχεδιασμένο ως μονάδα Python, η βιβλιοθήκη μας εξασφαλίζει τη συμβατότητα σε σημαντικά λειτουργικά συστήματα που υποστηρίζουν Java Αυτό σας δίνει τη δυνατότητα να αναπτύξετε εφαρμογές σε μία πλατφόρμα και να τις εκτελέσετε απρόσκοπτα σε άλλη, εξαλείφοντας την ανάγκη για τροποποιήσεις κώδικα.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Υποστηριζόμενες μορφές αρχείων

Aspose.OCR for Python via Java μπορεί να λειτουργήσει με οποιοδήποτε αρχείο Μπορείτε να πάρετε από σαρωτή ή κάμερα. Τα αποτελέσματα της αναγνώρισης μπορούν να αποθηκευτούν, να εισάγονται σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.

Εικόνες

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Παρτίδα OCR

  • Multi-page PDF
  • ZIP
  • Folder

Αποτελέσματα αναγνώρισης

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Αβίαστη εγκατάσταση για την Python μέσω Java

Το Aspose.ocr για την Python μέσω Java παραδίδεται ως πακέτο Python ή ως αρχείο που μπορεί να κατεβάσει με ελάχιστες εξαρτήσεις. Εύκολα εγκατάσταση αυτό στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε πολλαπλές υποστηριζόμενες γλώσσες και να αποθηκεύσετε την αναγνώριση σε διάφορες μορφές.

Ζητήστε άδεια δοκιμής για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.

Ισχυρό OCR για εφαρμογές Python

Η βιβλιοθήκη μας ενσωματώνει εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται άψογα σε οποιαδήποτε πλατφόρμα - επιτραπέζια παράθυρα, Windows Server, MacOS, Linux και το σύννεφο.

140+ γλώσσες αναγνώρισης

Το API Python και Java OCR αναγνωρίζει μια πληθώρα γλωσσών και δημοφιλών σεναρίων γραφής, συμπεριλαμβανομένων μικτών γλωσσών:

Αφήστε την ανίχνευση γλωσσών στη βιβλιοθήκη ή καθορίστε τη γλώσσα μόνοι σας για βελτιωμένη απόδοση και αξιοπιστία αναγνώρισης.

  • ** Extended Latin ** Αλφάβητο: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
  • ** Κυριλλικό ** Αλφάβητο: Ρωσικά, Ουκρανικά, Καζακ, Σερβικά, Λευκορωσιά, Βουλγαρικά.
  • Αραβικά, Περσικά, Ουρντού.
  • Κινέζικα και Devanagari σενάριο, συμπεριλαμβανομένων των Χίντι, Μαράθι, Bhojpuri και άλλων.

Ενισχυμένα φίλτρα επεξεργασίας εικόνας

Η ακρίβεια της αναγνώρισης οπτικού χαρακτήρα βασίζεται σε μεγάλο βαθμό στην ποιότητα της αρχικής εικόνας. Το Aspose.ocr για την Python μέσω Java προσφέρει ένα ευρύ φάσμα τόσο αυτοματοποιημένων όσο και χειροκίνητων φίλτρων επεξεργασίας εικόνας για να βελτιστοποιήσει μια εικόνα πριν από την υποβολή στον κινητήρα OCR:

  • Αυτόματη ισορροπία ελαφρώς κλίση εικόνων.
  • Διορθώστε με μη αυτόματο τρόπο την περιστροφή των αυστηρών λοξών εικόνων.
  • Αφαιρέστε αυτόματα τη βρωμιά, τις κηλίδες, τις γρατζουνιές, την αντανάκλαση, τις ανεπιθύμητες κλίσεις και άλλους τύπους θορύβου.
  • Ρυθμίστε αυτόματα την αντίθεση της εικόνας.
  • Αυτόματα αναβαθμισμένα ή χειροκίνητα το μέγεθος της εικόνας.
  • Μετατρέψτε τις εικόνες σε ασπρόμαυρο ή σε κλίμακα του γκρι.
  • Αναστροφή χρώματα εικόνας, κάνοντας τις περιοχές φωτός να εμφανίζονται σκοτεινές και σκοτεινές περιοχές να φαίνονται ελαφριά.
  • Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
  • Θορυβώδεις εικόνες θορυβώδους, διατηρώντας τα άκρα των επιστολών.
  • Ισιώστε τη σελίδα και τη σωστή παραμόρφωση του φακού της κάμερας στις φωτογραφίες της σελίδας.

Ειδικά API για διάφορους τύπους εγγράφων

Το Aspose.ocr για την Python μέσω της Java προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:

  • Σαρωμένες ή φωτογραφικές δεξαμενές ταυτότητας και διαβατήρια.
  • Πινακίδες κυκλοφορίας οχημάτων.
  • Τιμολόγια.
  • Αποδείξεις.

Ενσωματωμένος ορθογραφικός έλεγχος

Παρόλο που το ASPOSE.OCR για την Python μέσω Java παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυποποιημένες γραμματοσειρές μπορεί να προκαλέσουν εσφαλμένα ορισμένους χαρακτήρες ή λέξεις. Για να βελτιώσετε περαιτέρω τα αποτελέσματα αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα ορθογραφικά σφάλματα με βάση την επιλεγμένη γλώσσα αναγνώρισης.

Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντομογραφίες και άλλες λέξεις που δεν υπάρχουν σε κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.

Αποτελεσματική αναγνώριση παρτίδας

Το API Python OCR σας δίνει τη δυνατότητα να εξορθολογίσετε την αναγνώριση εικόνας. Χρησιμοποιήστε τις ευέλικτες μεθόδους επεξεργασίας παρτίδας για την αποτελεσματική επεξεργασία πολλαπλών εικόνων σε μία μόνο κλήση:

  • Αναγνωρίστε τα αρχεία PDF πολλαπλών σελίδων, TIFF.
  • Επεξεργαστείτε όλα τα αρχεία μέσα σε ένα φάκελο.
  • Χειριστείτε την αναγνώριση για όλα τα αρχεία σε ένα αρχείο.
  • Αναγνωρίστε εικόνες από μια συγκεκριμένη λίστα.

Μαθαίνοντας μέσω παραδείγματα Python

Εξερευνήστε μια ποικιλία από παραδείγματα Python που έχει σχεδιαστεί για να σας βοηθήσει να κατανοήσετε γρήγορα τις λειτουργίες και τις δυνατότητες της λύσης OCR μας. Κερδίστε γρήγορα τη δημιουργία προσαρμοσμένων λύσεων που πληρούν τις συγκεκριμένες επιχειρηματικές σας απαιτήσεις.

Χαρακτηριστικά και δυνατότητες

Aspose.OCR for Python via Java Εξερευνήστε τα προηγμένα χαρακτηριστικά του ASPOSE.OCR για Python

Feature icon

Φωτογραφία OCR

Εξαγάγετε κείμενο από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.

Feature icon

Pdf που μπορεί να αναζητηθεί

Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.

Feature icon

Αναγνώριση διεύθυνσης URL

Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.

Feature icon

Αναγνώριση χύδην

Διαβάστε όλες τις εικόνες από έγγραφα πολλαπλών σελίδων, φακέλους και αρχεία.

Feature icon

Οποιαδήποτε γραμματοσειρά και στυλ

Προσδιορίστε και αναγνωρίζετε το κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.

Feature icon

Αναγνώριση τελειοποίησης

Ρυθμίστε κάθε παράμετρο OCR για τα καλύτερα αποτελέσματα αναγνώρισης.

Feature icon

Ορθογραφικός έλεγχος

Βελτιώστε τα αποτελέσματα με αυτόματα τη διόρθωση των ορθογραφικών λέξεων.

Feature icon

Βρείτε κείμενο σε εικόνες

Αναζητήστε κείμενο ή κανονική έκφραση μέσα σε ένα σύνολο εικόνων.

Feature icon

Συγκρίνετε κείμενα εικόνας

Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.

Δείγματα κώδικα Python

Ανακαλύψτε τα δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το ASPOSE.OCR για την Python μέσω της Java στις εφαρμογές σας.

Αβίαστη εγκατάσταση

Ως πακέτο Python ή ένα αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις, το ASPOSE.OCR για την Python μέσω της Java εξασφαλίζει εύκολη διανομή. Ενσωματώστε το στο έργο σας απευθείας από την Python και είστε διατεθειμένοι να αξιοποιήσετε πλήρεις δυνατότητες OCR, η εξοικονόμηση αναγνώρισης έχει ως αποτέλεσμα διάφορες μορφές. Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, επιτρέποντάς σας να λάβετε τεκμηριωμένη απόφαση σχετικά με την αγορά ASPOSE.OCR για την Python μέσω της Java αργότερα.

Άδεια φόρτωσης

lic = License()
lic.set_license(self.licPath)

Αναγνώριση εικόνας

Η κύρια πρόκληση στις εφαρμογές OCR είναι η έλλειψη σαρωτών για τους τελικούς χρήστες. Το API μας, ενσωματωμένο απρόσκοπτα με την Python μέσω της Java, διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνων που χειρίζονται περιστρεφόμενα, λοξά και θορυβώδεις εικόνες. Σε συνδυασμό με την υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει αξιόπιστη αναγνώριση, ακόμη και από φωτογραφίες smartphone. Οι περισσότερες προ-επεξεργασία και διόρθωση εικόνας είναι αυτοματοποιημένες, απαιτώντας την παρέμβασή σας μόνο σε προκλητικές περιπτώσεις.

Εφαρμόστε αυτόματες διορθώσεις εικόνας - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Το API μας διαβάζει δεξιότητα οποιασδήποτε εικόνας από σαρωτές, κάμερες ή smartphones: έγγραφα PDF, JPEG, PNG, TIFF, GIF, BMP αρχεία. Η πλήρης υποστήριξη για τα έγγραφα πολλαπλών σελίδων PDF, οι εικόνες TIFF και DJVU εξασφαλίζουν την ευελιξία. Μπορείτε επίσης να δώσετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.

Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.

Αναγνωρίστε το PDF και αποθηκεύστε τα αποτελέσματα σε διάφορες μορφές εξόδου - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Βελτιστοποίηση της χρήσης πόρων

Το OCR προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης για την εξαγωγή περιεχομένου από εικόνες με αραιό κείμενο και θορυβώδη/έγχρωμο φόντο. Αυτή η μέθοδος βελτιώνει σημαντικά την ακρίβεια OCR στις ακόλουθες επιχειρηματικές περιπτώσεις:

  • Διαβάστε το κείμενο από τις φωτογραφίες του δρόμου.
  • Τμήμα και εντοπισμός οδικών πινακίδων και πινακίδων εντός εικόνων δρόμου.
  • Εντοπίστε τις ετικέτες τιμών και ερμηνεύστε το εξαγόμενο κείμενο ως τιμές.
  • Βρείτε και συνολικές περιοχές ενδιαφέροντος στις ετικέτες τροφίμων, όπως διατροφικές πληροφορίες ή λίστες συστατικών.
  • Προσδιορίστε και αναλύστε τις πινακίδες κυκλοφορίας αυτοκινήτων.
  • Εξαγάγετε κείμενο από μενού και καταλόγους.

Ανοιχτή περιοχή OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Εξαγωγή κειμένου από φωτογραφίες δρόμου

Το OCR για την Python προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης που εξάγει κείμενο από πινακίδες κυκλοφορίας οχημάτων, συμπεριλαμβανομένων των σκοτεινών και θολών φωτογραφιών. Το προκύπτον κείμενο μπορεί στη συνέχεια να αποθηκευτεί αυτόματα στη βάση δεδομένων ή να επαληθευτεί αυτόματα.

Αναγνωρίστε τον αριθμό αυτοκινήτου - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)