Γιατί το Aspose.OCR για Python μέσω Java;

Το Aspose.OCR για Python μέσω Java ενσωματώνει απρόσκοπτα ισχυρές δυνατότητες οπτικής αναγνώρισης χαρακτήρων (OCR) στους φορητούς υπολογιστές Python και τις εφαρμογές σας σε πολλαπλές πλατφόρμες. Με το διαισθητικό και υψηλής ταχύτητας API μας, μπορείτε να εξαγάγετε αβίαστα κείμενο από σαρώσεις, στιγμιότυπα οθόνης, συνδέσμους ιστού ή φωτογραφίες smartphone, παρέχοντας αποτελέσματα που είναι έτοιμα για ενοποίηση, ανάλυση ή αποθήκευση. Αναγνωρίστε σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης και σαρωμένα αρχεία PDF, αποθηκεύοντας αποτελέσματα σε δημοφιλείς μορφές εγγράφων. Τα προηγμένα φίλτρα προεπεξεργασίας χειρίζονται περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Βελτιστοποιήστε την απόδοση μεταφορτώνοντας εργασίες στη GPU.

Illustration ocr

Γρήγορη και ακριβή OCR

Επιτύχετε υψηλής ταχύτητας και ακριβή αποτελέσματα OCR με την προηγμένη Python μας μέσω τεχνολογίας Java.

Πολυγλωσσική Υποστήριξη

Αναγνωρίστε κείμενο σε 28 γλώσσες, συμπεριλαμβανομένων λατινικών, κυριλλικών και κινεζικών σεναρίων, διασφαλίζοντας ευελιξία για τις εφαρμογές σας Python μέσω Java.

Ευέλικτη υποστήριξη εικόνας

Επεξεργαστείτε εικόνες από σαρωτές, κάμερες και smartphone απρόσκοπτα με Python μέσω Java.

Ακρίβεια στην αναγνώριση κινεζικών χαρακτήρων

Αναγνωρίστε πάνω από 6.000 κινεζικούς χαρακτήρες με ακρίβεια στα έργα Python σας μέσω Java.

Διατηρήστε τα στυλ γραμματοσειράς και τη μορφοποίηση

Διατηρήστε στυλ γραμματοσειράς και μορφοποίηση για ακριβή αναπαράσταση αναγνωρισμένου κειμένου στις εφαρμογές Python σας μέσω Java.

Ζωντανό δείγμα κώδικα

Ξεκινήστε την αναγνώριση κειμένου από εικόνες σε τρεις μόνο γραμμές κώδικα. Ζήστε την απλότητα!

Έτοιμος να αναγνωρίσει Έτοιμος να αναγνωρίσει Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για περιήγηση *

* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Οροι χρήσης και Πολιτική Απορρήτου.

Αποτέλεσμα αναγνώρισης
 

Μετατροπή εικόνας σε κείμενο

Περισσότερα παραδείγματα >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Συμβατότητα Java Backend

Σχεδιασμένη ως λειτουργική μονάδα Python, η βιβλιοθήκη μας διασφαλίζει τη συμβατότητα με τα κύρια λειτουργικά συστήματα που υποστηρίζουν Java - συμπεριλαμβανομένων των Microsoft Windows, Linux και macOS ή πλατφόρμες cloud. Αυτό σας δίνει τη δυνατότητα να αναπτύξετε εφαρμογές σε μια πλατφόρμα και να τις εκτελείτε απρόσκοπτα σε μια άλλη, εξαλείφοντας την ανάγκη για τυχόν τροποποιήσεις κώδικα.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Υποστηριζόμενες μορφές αρχείων

Aspose.OCR for Python via Java μπορεί να λειτουργήσει με σχεδόν οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης επιστρέφονται στις πιο δημοφιλείς μορφές ανταλλαγής αρχείων και δεδομένων που μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.

εικόνες

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Παρτίδα OCR

  • Multi-page PDF
  • ZIP
  • Folder

Αποτελέσματα αναγνώρισης

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Εύκολη εγκατάσταση για Python μέσω Java

Το Aspose.OCR για Python μέσω Java παραδίδεται ως πακέτο Python ή ως αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις. εγκαταστήστε εύκολα στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε πολλές υποστηριζόμενες γλώσσες και να αποθηκεύσετε αποτελέσματα αναγνώρισης σε διάφορες μορφές.

Ζητήστε μια δοκιμαστική άδεια για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.

Ισχυρό OCR για εφαρμογές Python

Η βιβλιοθήκη μας ενσωματώνεται εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται απρόσκοπτα σε οποιαδήποτε πλατφόρμα – επιτραπέζιους υπολογιστές Windows, Windows Server, macOS, Linux και cloud.

28 Γλώσσες αναγνώρισης

Το Python και το Java OCR API αναγνωρίζει μια πληθώρα γλωσσών και δημοφιλών σεναρίων γραφής, συμπεριλαμβανομένων μικτών γλωσσών:

Αφήστε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή ορίστε τη γλώσσα μόνοι σας για βελτιωμένη απόδοση αναγνώρισης και αξιοπιστία.

  • Εκτεταμένο λατινικό αλφάβητο: Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
  • Κυριλλικό αλφάβητο: Λευκορωσικά, Βουλγαρικά, Καζακικά, Ρωσικά, Σερβικά, Ουκρανικά.
  • Κινέζικα: Πάνω από 6.000 χαρακτήρες.
  • Χίντι.

Βελτιωμένα φίλτρα επεξεργασίας εικόνας

Η ακρίβεια της οπτικής αναγνώρισης χαρακτήρων βασίζεται σε μεγάλο βαθμό στην ποιότητα της αρχικής εικόνας. Το Aspose.OCR για Python μέσω Java προσφέρει ένα ευρύ φάσμα αυτοματοποιημένων και μη αυτόματων φίλτρων επεξεργασίας εικόνας για τη βελτιστοποίηση μιας εικόνας πριν από την υποβολή στη μηχανή OCR:

  • Αυτόματη ευθυγράμμιση εικόνων με ελαφρά κλίση.
  • Διορθώστε χειροκίνητα την περιστροφή των πολύ λοξών εικόνων.
  • Αφαιρέστε αυτόματα τη βρωμιά, τα σημεία, τις γρατσουνιές, τη λάμψη, τις ανεπιθύμητες κλίσεις και άλλους τύπους θορύβου.
  • Προσαρμόστε αυτόματα την αντίθεση της εικόνας.
  • Αυτόματη αναβάθμιση ή μη αυτόματη αλλαγή μεγέθους της εικόνας.
  • Μετατροπή εικόνων σε ασπρόμαυρες ή σε κλίμακα του γκρι.
  • Αντιστρέψτε τα χρώματα της εικόνας, κάνοντας τις φωτεινές περιοχές να φαίνονται σκοτεινές και οι σκοτεινές περιοχές να φαίνονται ανοιχτές.
  • Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
  • Θολώστε τις θορυβώδεις εικόνες διατηρώντας τις άκρες των γραμμάτων.
  • Ισιώστε τη λοξή σελίδα και διορθώστε την παραμόρφωση του φακού της κάμερας στις φωτογραφίες της σελίδας.

Εξειδικευμένα API για διάφορους τύπους εγγράφων

Το Aspose.OCR για Python μέσω Java προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:

  • Σαρωμένα ή φωτογραφημένα δελτία ταυτότητας και διαβατήρια.
  • Πινακίδες κυκλοφορίας οχημάτων.
  • τιμολόγια.
  • ΑΠΟΔΕΙΞΗ ΕΙΣΠΡΑΞΗΣ.

Ενσωματωμένος ορθογραφικός έλεγχος

Παρόλο που το Aspose.OCR για Python μέσω Java παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυπικές γραμματοσειρές ενδέχεται να προκαλέσουν εσφαλμένη αναγνώριση ορισμένων χαρακτήρων ή λέξεων. Για περαιτέρω βελτίωση των αποτελεσμάτων αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα τα ορθογραφικά λάθη με βάση την επιλεγμένη γλώσσα αναγνώρισης.

Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντομογραφίες και άλλες λέξεις που δεν υπάρχουν στα κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.

Αποτελεσματική αναγνώριση παρτίδων

Το Python OCR API σας δίνει τη δυνατότητα να βελτιστοποιήσετε την αναγνώριση εικόνων. Χρησιμοποιήστε ευέλικτες μεθόδους μαζικής επεξεργασίας για αποτελεσματική επεξεργασία πολλαπλών εικόνων σε μία μόνο κλήση:

  • Αναγνώριση πολυσέλιδων αρχείων PDF, TIFF.
  • Επεξεργαστείτε όλα τα αρχεία σε έναν φάκελο.
  • Χειριστείτε την αναγνώριση για όλα τα αρχεία σε ένα αρχείο.
  • Αναγνώριση εικόνων από μια καθορισμένη λίστα.

Εκμάθηση μέσω Παραδειγμάτων Python

Εξερευνήστε μια ποικιλία από παραδείγματα Python που έχουν σχεδιαστεί για να σας βοηθήσουν να κατανοήσετε γρήγορα τις λειτουργίες και τις δυνατότητες της λύσης OCR μας. Αποκτήστε γρήγορα πληροφορίες για τη δημιουργία προσαρμοσμένων λύσεων που ανταποκρίνονται στις συγκεκριμένες απαιτήσεις της επιχείρησής σας.

Χαρακτηριστικά και Δυνατότητες

Aspose.OCR for Python via Java Εξερευνήστε τις προηγμένες δυνατότητες του Aspose.OCR για Python

Feature icon

Φωτογραφία OCR

Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.

Feature icon

PDF με δυνατότητα αναζήτησης

Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.

Feature icon

Αναγνώριση URL

Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.

Feature icon

Μαζική αναγνώριση

Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.

Feature icon

Οποιαδήποτε γραμματοσειρά και στυλ

Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.

Feature icon

Αναγνώριση με ακρίβεια

Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.

Feature icon

Ορθογραφικός έλεγχος

Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.

Feature icon

Βρείτε κείμενο σε εικόνες

Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.

Feature icon

Συγκρίνετε κείμενα εικόνων

Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.

Δείγματα κώδικα Python

Ανακαλύψτε δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το Aspose.OCR για Python μέσω Java στις εφαρμογές σας.

Αβίαστη Εγκατάσταση

Ως πακέτο Python ή αρχείο με δυνατότητα λήψης με ελάχιστες εξαρτήσεις, το Aspose.OCR για Python μέσω Java εξασφαλίζει εύκολη διανομή. Ενσωματώστε το στο έργο σας απευθείας από την Python και είστε έτοιμοι να αξιοποιήσετε πλήρεις δυνατότητες OCR, αποθηκεύοντας αποτελέσματα αναγνώρισης σε διάφορες μορφές.

Μετά την εγκατάσταση, ξεκινήστε αμέσως τη χρήση του Aspose.OCR για Python μέσω Java, αν και με ορισμένους περιορισμούς. Μια προσωρινή άδεια καταργεί όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, η οποία σας επιτρέπει να λάβετε μια τεκμηριωμένη απόφαση σχετικά με την αγορά του Aspose.OCR για Python μέσω Java αργότερα.

Φόρτωση άδειας

lic = License()
lic.set_license(self.licPath)

Αναγνώριση εικόνας

Η κύρια πρόκληση στις εφαρμογές OCR είναι η έλλειψη σαρωτών για τους τελικούς χρήστες. Το API μας, ενσωματωμένο άψογα με την Python μέσω Java, διαθέτει ισχυρά ενσωματωμένα φίλτρα προεπεξεργασίας εικόνας που χειρίζονται περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Σε συνδυασμό με υποστήριξη για όλες τις μορφές εικόνας, επιτρέπει αξιόπιστη αναγνώριση, ακόμη και από φωτογραφίες smartphone. Οι περισσότερες προεπεξεργασίες και διόρθωση εικόνας είναι αυτοματοποιημένες, απαιτώντας την παρέμβασή σας μόνο σε δύσκολες περιπτώσεις.

Εφαρμογή αυτόματων διορθώσεων εικόνας - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Το API μας διαβάζει επιδέξια οποιαδήποτε εικόνα από σαρωτές, κάμερες ή smartphone: έγγραφα PDF, αρχεία JPEG, PNG, TIFF, GIF, BMP. Η πλήρης υποστήριξη για έγγραφα PDF πολλών σελίδων, εικόνες TIFF και DjVu εξασφαλίζει ευελιξία. Μπορείτε επίσης να παρέχετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.

Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.

Αναγνώριση PDF και αποθήκευση αποτελεσμάτων σε διάφορες μορφές εξόδου - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Βελτιστοποίηση χρήσης πόρων

Το OCR προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης για την εξαγωγή περιεχομένου από εικόνες με αραιό κείμενο και θορυβώδες/έγχρωμο φόντο. Αυτή η μέθοδος βελτιώνει σημαντικά την ακρίβεια OCR στις ακόλουθες επιχειρηματικές περιπτώσεις:

  • Διαβάστε κείμενο από φωτογραφίες δρόμου.
  • Τμηματοποιήστε και αναγνωρίστε οδικές πινακίδες και πινακίδες εντός εικόνων δρόμου.
  • Εντοπίστε ετικέτες τιμών και ερμηνεύστε το εξαγόμενο κείμενο ως τιμές.
  • Βρείτε και συγκεντρώστε περιοχές ενδιαφέροντος στις ετικέτες τροφίμων, όπως διατροφικές πληροφορίες ή λίστες συστατικών.
  • Αναγνώριση και ανάλυση πινακίδων κυκλοφορίας αυτοκινήτων.
  • Εξαγωγή κειμένου από μενού και καταλόγους.

Ανοιχτή περιοχή OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Εξαγωγή κειμένου από φωτογραφίες δρόμου

Το OCR for Python προσφέρει έναν ειδικό αλγόριθμο αναγνώρισης που εξάγει κείμενο από πινακίδες κυκλοφορίας οχημάτων, συμπεριλαμβανομένων σκοτεινών και θολών φωτογραφιών. Το κείμενο που προκύπτει μπορεί στη συνέχεια να αποθηκευτεί αυτόματα στη βάση δεδομένων ή να επαληθευτεί αυτόματα.

Αναγνώριση αριθμού αυτοκινήτου - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)