Python OCR Library
Μετατρέψτε τις εικόνες σε κείμενο με Python OCR
Περισσότερες προθήκες ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Γιατί Aspose.OCR για Python μέσω .NET;
Ξεκινήστε ένα ταξίδι με το Aspose OCR για Python μέσω .NET – ένα ευέλικτο και φιλικό προς το χρήστη API OCR. Ενσωματώστε τη λειτουργικότητα OCR στις εφαρμογές σας Python με λιγότερες από 5 γραμμές κώδικα, εξαλείφοντας την ανάγκη για πολύπλοκα μαθηματικά ή νευρωνικά δίκτυα. Ο ισχυρός μας κινητήρας OCR προσφέρει απαράμιλλη ταχύτητα και ακρίβεια, υποστηρίζοντας 130+ γλώσσες, όπως Αγγλικά, Κυριλλικά, Αραβικά, Περσικά, Χίντι, Κινέζικα, Ιαπωνικά, Κορεάτικα, Ταμίλ και πολλές άλλες. Είτε πρόκειται για σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης ή σαρωμένα PDF, αποκτήστε αποτελέσματα σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Αξιοποιήστε τα φίλτρα προεπεξεργασίας για να χειριστείτε περιστρεφόμενες, λοξές και θορυβώδεις εικόνες.
Αποτελεσματική και ακριβής OCR
Απολαύστε απαράμιλλη ταχύτητα και ακρίβεια στα αποτελέσματα OCR με την προηγμένη τεχνολογία Python.
Πολύγλωσσος
Αναγνώριση κειμένου σε 140+ γλώσσες: Αγγλικά, Γαλλικά, Γερμανικά, Ισπανικά, Ρωσικά, Κινέζικα, Χίντι, Ιαπωνικά, Κορεάτικα, Ταμίλ, Αραβικά, Περσικά και άλλα.
Παγκόσμιος
Επεξεργαστείτε εύκολα εικόνες από διαφορετικές πηγές –σαρωτές, κάμερες και smartphones– χρησιμοποιώντας Python.
ασιατικές γλώσσες
Επιτύχετε ακριβή αναγνώριση κινεζικών, αραβικών, ντεβαναγάρι και δραβιδικών κειμένων, καθώς και κειμένων μεικτών γλωσσών.
Διατήρηση διάταξης
Διατηρήστε τη μορφοποίηση της πηγής για ακριβή αναπαράσταση κειμένου και αναγνωρίστε τους πίνακες.
Ζωντανό δείγμα κώδικα
Μετατρέψτε μια εικόνα σε κείμενο με μόνο ΤΡΕΙΣ γραμμές κώδικα Python. Δοκιμάστε μόνοι σας!
* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Όροι χρήσης και Πολιτική Απορρήτου.
Μετατροπή εικόνας σε κείμενο
Ανακαλύψτε περισσότερα παραδείγματα ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Επιλέξτε την προτίμησή σας
Επιλέξτε τη σωστή βιβλιοθήκη για τις ανάγκες σας. Εξερευνήστε τα διαθέσιμα API και τις δυνατότητές τους για να επιλέξετε την πιο αποτελεσματική λύση.
Ευστροφία
Python via .NET
Ομοιομορφία
Python via Java
Εκτέλεση
Python via C++
Τρέχει παντού
Ανεξάρτητα από το όνομα, το Aspose.OCR για Python μέσω .NET δεν απαιτεί την εγκατάσταση του .NET στην πλατφόρμα προορισμού. Το πακέτο εγκατάστασης έρχεται ήδη με όλα τα απαιτούμενα εξαρτήματα και μπορεί να λειτουργήσει απρόσκοπτα σε οποιαδήποτε πλατφόρμα – είτε πρόκειται για τοπικό μηχάνημα, είτε για διακομιστή ιστού είτε για το cloud.
Υποστηριζόμενες μορφές αρχείων
Aspose.OCR for Python via .NET μπορεί να λειτουργήσει με οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.
εικόνες
- JPEG
- PNG
- TIFF
- BMP
- GIF
Παρτίδα OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Αποτελέσματα αναγνώρισης
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Εγκατάσταση
Το Aspose.OCR για Python μέσω .NET παραδίδεται ως πακέτο Python με ελάχιστες εξαρτήσεις ή ως αρχείο με δυνατότητα λήψης ή [πακέτο PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Εύκολα εγκαταστήστε στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε 140+ γλώσσες και να αποθηκεύσετε αποτελέσματα αναγνώρισης σε διάφορες μορφές.
Ζητήστε μια δοκιμαστική άδεια για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.
OCR κάτω από Python
Η βιβλιοθήκη μας ενσωματώνεται εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται απρόσκοπτα σε οποιαδήποτε πλατφόρμα – επιτραπέζιους υπολογιστές Windows, Windows Server, macOS, Linux και cloud.
140+ Γλώσσες Αναγνώρισης
Η βιβλιοθήκη Java OCR μας είναι μια καθολική λύση για την επεξεργασία εγγράφων, την εξαγωγή δεδομένων και την ψηφιοποίηση περιεχομένου σε παγκόσμια κλίμακα. Με υποστήριξη για μια τεράστια γκάμα σεναρίων γραφής από την Ευρώπη, τη Μέση Ανατολή και την Ασία, είναι καλά προσαρμοσμένο για κάθε χώρα και επιχείρηση.
Το Aspose OCR για Java αναγνωρίζει κείμενο σε πολύγλωσσα έγγραφα, όπως Κινεζικά/Αγγλικά, Αραβικά/Γαλλικά ή Κυριλλικά/Αγγλικά. Υποστηρίζονται οι ακόλουθες γλώσσες:
- Εκτεταμένα Λατινικά: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
- Κυριλλικό αλφάβητο: Ρωσικά, Ουκρανικά, Καζακικά, Βουλγαρικά, συμπεριλαμβανομένων μικτών κυριλλικών/αγγλικών κειμένων.
- Αραβικά, Περσικά, Ουρντού, συμπεριλαμβανομένων κειμένων ανάμεικτα με αγγλικά.
- Κινεζικά, Κορεατικά, Ιαπωνικά, Devanagari και Δραβιδικές γλώσσες, συμπεριλαμβανομένων των Χίντι, Ταμίλ, Μαράθι και άλλων. Υποστηρίζονται επίσης μικτά κείμενα.
Ισχυρά φίλτρα επεξεργασίας
Η ακρίβεια και η αξιοπιστία της οπτικής αναγνώρισης χαρακτήρων εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής εικόνας. Το Aspose OCR για Python μέσω .NET προσφέρει έναν μεγάλο αριθμό πλήρως αυτοματοποιημένων και μη αυτόματων φίλτρων επεξεργασίας εικόνας που βελτιώνουν μια εικόνα πριν σταλεί στη μηχανή OCR:
- Αυτόματη περιστροφή ανάποδα και περιστρεφόμενων εικόνων.
- Εντοπίστε ανεστραμμένες εικόνες και εξάγετε κείμενο λευκό σε μαύρο.
- Αφαιρέστε αυτόματα τη βρωμιά, τα σημεία, τις γρατσουνιές, τη λάμψη, τις ανεπιθύμητες κλίσεις και άλλους θορύβους.
- Προσαρμόστε αυτόματα την αντίθεση της εικόνας.
- Αυτόματη αναβάθμιση ή μη αυτόματη αλλαγή μεγέθους της εικόνας.
- Μετατροπή εικόνων σε ασπρόμαυρες ή σε κλίμακα του γκρι.
- Βρείτε δυνητικά προβληματικές περιοχές της εικόνας και επιστρέψτε τις πληροφορίες σχετικά με τον τύπο του ελαττώματος και τις συντεταγμένες του.
- Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
- Θολώστε τις θορυβώδεις εικόνες διατηρώντας τις άκρες των γραμμάτων.
- Ισιώστε την καμπυλότητα της σελίδας και διορθώστε την παραμόρφωση του φακού της κάμερας για φωτογραφίες σελίδας.
Βελτιστοποιημένο για συγκεκριμένους τύπους εγγράφων
Το Aspose OCR for Python μέσω .NET προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:
Ενσωματωμένος ορθογραφικός έλεγχος
Παρόλο που η βιβλιοθήκη Python OCR μας παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυπικές γραμματοσειρές ενδέχεται να έχουν ως αποτέλεσμα την εσφαλμένη αναγνώριση ορισμένων χαρακτήρων ή λέξεων. Για περαιτέρω βελτίωση των αποτελεσμάτων αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα τα ορθογραφικά λάθη με βάση την επιλεγμένη γλώσσα αναγνώρισης.
Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντμήσεις και άλλες λέξεις που δεν υπάρχουν σε κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.
Αναγνώριση παρτίδας
Το Python OCR API σας απελευθερώνει από την αναγνώριση εικόνων μία προς μία. Χρησιμοποιήστε διάφορες μεθόδους επεξεργασίας παρτίδας για την αναγνώριση πολλαπλών εικόνων σε μία κλήση:
- Αναγνώριση πολυσέλιδων αρχείων PDF, TIFF και DjVu.
- Αναγνώριση όλων των αρχείων σε ένα φάκελο.
- Αναγνώριση όλων των αρχείων σε ένα αρχείο.
- Αναγνώριση όλων των αρχείων από μια λίστα.
Μάθηση με δείγμα
Το OCR για Python παρέχει μια σειρά από παραδείγματα γραμμένα σε Python, επιτρέποντάς σας να εξοικειωθείτε γρήγορα με τις λειτουργίες και τις δυνατότητές του. Αποκτήστε πληροφορίες για τη δημιουργία προσαρμοσμένων λύσεων για να καλύψετε τις επιχειρηματικές σας ανάγκες Python.
Χαρακτηριστικά και δυνατότητες
Aspose.OCR for Python via .NET λύνει τις εργασίες σας γρήγορα και εύκολα.
Φωτογραφία OCR
Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.
PDF με δυνατότητα αναζήτησης
Μετατρέψτε οποιαδήποτε σάρωση σε έγγραφο με δυνατότητα αναζήτησης, ευρετηρίασης και επεξεργασίας.
Αναγνώριση URL
Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.
Μαζική αναγνώριση
Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.
Οποιαδήποτε γραμματοσειρά και στυλ
Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.
Αναγνώριση με ακρίβεια
Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.
Ορθογραφικός έλεγχος
Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.
Βρείτε κείμενο σε εικόνες
Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.
Συγκρίνετε κείμενα εικόνων
Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.
Δείγματα κώδικα Python
Εμβαθύνετε σε δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το OCR στις εφαρμογές σας Python.
Εγκατάσταση
Διανέμεται ως Python Wheel ή αυτόνομο πακέτο με δυνατότητα λήψης, το Aspose.OCR για Python μέσω .NET διανέμεται εύκολα. Η ενσωμάτωση στο έργο Python σας, απευθείας από το προτιμώμενο περιβάλλον ανάπτυξης Python (IDE), είναι μια απρόσκοπτη διαδικασία. Απλώς εγκαταστήστε το και είστε έτοιμοι να αξιοποιήσετε το πλήρες φάσμα των δυνατοτήτων OCR, αποθηκεύοντας αποτελέσματα αναγνώρισης σε διάφορες μορφές.
Μετά την εγκατάσταση, μπορείτε να ξεκινήσετε αμέσως τη χρήση του Aspose.OCR για Python μέσω .NET , αν και με ορισμένους περιορισμούς. Μια προσωρινή άδεια αίρει όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, η οποία σας επιτρέπει να λάβετε μια τεκμηριωμένη απόφαση για την αγορά του Aspose.OCR για Python μέσω .NET σε μεταγενέστερο στάδιο.
Φόρτωση άδειας
lic = License()
lic.set_license(self.licPath)
Αναγνώριση κειμένου στις Φωτογραφίες
Η ανάγνωση κειμένου από οποιοδήποτε περιεχόμενο στο Aspose OCR για Python είναι τόσο εύκολη όσο η κλήση μιας μεθόδου καθολικής αναγνώρισης.
Μετατροπή φωτογραφίας σε κείμενο - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
Το API μας διαβάζει επιδέξια οποιαδήποτε εικόνα από σαρωτές, κάμερες ή smartphone: έγγραφα PDF, JPEG, PNG, TIFF, GIF, εικόνες BMP, ακόμη και αρχεία DjVu. Η πλήρης υποστήριξη για έγγραφα PDF πολλών σελίδων, εικόνες TIFF και DjVu εξασφαλίζει ευελιξία. Μπορείτε επίσης να παρέχετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.
Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.
Αναγνώριση PDF και αποθήκευση αποτελεσμάτων σε διάφορες μορφές εξόδου - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Βελτιστοποίηση πόρων στην Python
Η οπτική αναγνώριση χαρακτήρων απαιτεί πόρους. Το API μας προσφέρει ευέλικτους τρόπους εξισορρόπησης της κλασικής τριάδας χρόνου-τιμής-ποιότητας:
- Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
- Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
- Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στο backend .NET.
Γρήγορη αναγνώριση - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Αναγνωρίστε μια γραμμή
Εάν η εικόνα σας έχει ήδη περικοπεί σε μία γραμμή κειμένου, μπορεί να αναγνωριστεί με την ταχύτερη δυνατή λειτουργία, χωρίς αυτοματοποιημένες διορθώσεις, ανίχνευση δομής περιεχομένου και άλλα βήματα που καταναλώνουν πόρους. Μπορεί να επιταχύνει το OCR έως και 7 φορές πιο γρήγορα από την κανονική διαδικασία αναγνώρισης.
Αναγνώριση μιας γραμμής κειμένου στην εικόνα - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)