OCR for Java

OCR for C++

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via .NET

Βιβλιοθήκη Python OCR

Εξαγάγετε κείμενα από εικόνες στην εφαρμογή Python χρησιμοποιώντας τη βιβλιοθήκη Python OCR. Μετατρέψτε τις εικόνες σε κείμενο αβίαστα με συνοπτικό κωδικό API Python, ξεκλειδώνοντας τις προηγμένες δυνατότητες OCR.

Κατεβάζω Δίκη Αγορά

Δείτε τι νέο υπάρχει

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-net

Γιατί το Aspose.ocr για την Python μέσω του .net;

Ξεκινήστε ένα ταξίδι με το ASPOSE OCR για την Python μέσω του .NET-ένα ευπροσάρμοστο και φιλικό προς το χρήστη OCR API. Ενσωματώστε τη λειτουργικότητα OCR στις εφαρμογές Python με λιγότερες από 5 γραμμές κώδικα, εξαλείφοντας την ανάγκη για σύνθετα μαθηματικά ή νευρωνικά δίκτυα. Ο ισχυρός μας κινητήρας OCR προσφέρει απαράμιλλη ταχύτητα και ακρίβεια, υποστηρίζοντας 140+ γλώσσες, συμπεριλαμβανομένων αγγλικών, κυριλλικών, αραβικών, περσικών, Χίντι, κινεζικών, ιαπωνικών, κορεατικών, ταμίλ και πολλά άλλα. Είτε πρόκειται για σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης ή σαρωμένα PDFs, λαμβάνετε αποτελέσματα σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Αξιοποιήστε τα φίλτρα προεπεξεργασίας για να χειρίζεστε περιστρεφόμενες, λοξές και θορυβώδεις εικόνες.

Αποτελεσματικό και ακριβές OCR

Ζήστε απαράμιλλη ταχύτητα και ακρίβεια σε αποτελέσματα OCR με προηγμένη τεχνολογία Python.

Πολύγλωσσος

Αναγνωρίστε το κείμενο σε 140+ γλώσσες: Αγγλικά, Γαλλικά, Γερμανικά, Ισπανικά, Ρωσικά, Κινέζικα, Χίντι, Ιαπωνικά, Κορεατικά, Ταμίλ, Αραβικά, Περσικά και πολλά άλλα.

Παγκόσμιος

Επεξεργαστείτε αβίαστα εικόνες από διαφορετικές πηγές - σαρωτές, κάμερες και smartphones - χρησιμοποιώντας Python.

Ασιατικές γλώσσες

Επιτύχετε ακριβή αναγνώριση των κινεζικών, αραβικών, Devanagari και Dravidian σεναρίων, καθώς και κειμένων μικτών γλωσσών.

Διατήρηση της διάταξης

Διατηρήστε τη μορφοποίηση προέλευσης για ακριβή αναπαράσταση κειμένου και αναγνωρίζετε τους πίνακες.

Δείγμα ζωντανού κώδικα

Μετατρέψτε μια εικόνα σε κείμενο σε μόλις τρεις γραμμές του κώδικα Python. Δοκιμάστε για τον εαυτό σας!

Έτοιμος να αναγνωρίσει Έτοιμος να αναγνωρίσει Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε *

* Μεταφορτώντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία που συμφωνείτε με το δικό μας Όροι χρήσης και Πολιτική απορρήτου.

Αποτέλεσμα αναγνώρισης

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Επιλέξτε την προτίμησή σας

Επιλέξτε τη σωστή βιβλιοθήκη για τις ανάγκες σας. Εξερευνήστε τα διαθέσιμα API και τις δυνατότητές τους για να επιλέξετε την πιο αποτελεσματική λύση.

Python via .NET

Εύκολη ανάπτυξη, αναγνωσιμότητα και διατήρηση του κώδικα

Διαθέτει τα περισσότερα χαρακτηριστικά και λαμβάνει τις πιο συχνές ενημερώσεις

Η συνολική ταχύτητα μπορεί να είναι λίγο πιο αργή από άλλες πλατφόρμες

Python via Java

Χρησιμοποιήστε την ίδια βιβλιοθήκη σε οποιαδήποτε πλατφόρμα

Εκτελέστε απρόσκοπτα την αίτησή σας σε οποιαδήποτε συσκευή

Απαιτεί το Java Runtime Environment (JRE) Έκδοση 8 ή αργότερα

Python via C++

Την ταχύτερη δυνατή ταχύτητα ανεξάρτητα από την πλατφόρμα

Πολύς έλεγχος της διαχείρισης των πόρων

Στοχεύει σε έμπειρους προγραμματιστές

Τρέχει παντού

Ανεξάρτητα από το όνομα, το aspose.ocr για την Python μέσω του .net δεν απαιτεί την εγκατάσταση του .net στην πλατφόρμα προορισμού. Το πακέτο εγκατάστασης έρχεται ήδη με όλα τα απαιτούμενα στοιχεία και μπορεί να λειτουργήσει άψογα σε οποιαδήποτε πλατφόρμα - είτε πρόκειται για τοπικό μηχάνημα, διακομιστή ιστού είτε για το σύννεφο.

Υποστηριζόμενες μορφές αρχείων

Aspose.OCR for Python via .NET μπορεί να λειτουργήσει με οποιοδήποτε αρχείο Μπορείτε να πάρετε από σαρωτή ή κάμερα. Τα αποτελέσματα της αναγνώρισης μπορούν να αποθηκευτούν, να εισάγονται σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.

Εικόνες

JPEG
PNG
TIFF
BMP
GIF

Παρτίδα OCR

Multi-page PDF
DjVu
ZIP
Folder

Αποτελέσματα αναγνώρισης

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Εγκατάσταση

Το Aspose.ocr για το Python μέσω του .NET παραδίδεται ως πακέτο Python με ελάχιστες εξαρτήσεις ή ως αρχείο που μπορεί να κατεβάσει]( https://releases.aspose.com/ocr/python-net/ ) ή PYPI Package . Εύκολα εγκατάσταση αυτό στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε 140+ γλώσσες και να αποθηκεύσετε τα αποτελέσματα αναγνώρισης σε διάφορες μορφές.

Ζητήστε άδεια δοκιμής για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.

OCR κάτω από Python

Η βιβλιοθήκη μας ενσωματώνει εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται άψογα σε οποιαδήποτε πλατφόρμα - επιτραπέζια παράθυρα, Windows Server, MacOS, Linux και το σύννεφο.

140+ γλώσσες αναγνώρισης

Η βιβλιοθήκη Java OCR είναι μια καθολική λύση για την επεξεργασία εγγράφων, την εξαγωγή δεδομένων και την ψηφιοποίηση περιεχομένου σε παγκόσμια κλίμακα. Με την υποστήριξη για μια τεράστια ποικιλία σε σενάρια ευρωπαϊκών, μεσαίων και ασιατικών γραφείων, είναι καλά προσαρμοσμένο σε οποιαδήποτε χώρα και επιχειρήσεις.

Το ASPOSE OCR για Java αναγνωρίζει κείμενο σε πολύγλωσσα έγγραφα, όπως κινεζικά/αγγλικά, αραβικά/γαλλικά ή κυριλλικά/αγγλικά. Υποστηρίζονται οι παρακάτω γλώσσες:

** Extended Latin **: Αγγλικά, Ισπανικά, Γαλλικά, Ινδονησιακά, Πορτογαλικά, Γερμανικά, Βιετναμέζικα, Τουρκικά, Ιταλικά, Πολωνικά και 80+ άλλα.
** Cyrillic ** Αλφάβητο: Ρωσικά, Ουκρανικά, Καζακ, βουλγαρικά, συμπεριλαμβανομένων μικτών κυριλλικών/αγγλικών κειμένων.
Αραβικά, Περσικά, Ουρντού, συμπεριλαμβανομένων κειμένων που αναμιγνύονται με τα αγγλικά.
Κινέζικα, Κορεατικά, Ιαπωνικά, Ντέβανγκαρη και Dravidian Γλώσσες, συμπεριλαμβανομένου του Χίντι, του Ταμίλ, του Μαράθι και άλλων. Τα κείμενα μικτής γλώσσας υποστηρίζονται επίσης.

Ισχυρά φίλτρα επεξεργασίας

Η ακρίβεια και η αξιοπιστία της αναγνώρισης οπτικού χαρακτήρα εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής εικόνας. Το ASPOSE OCR για το Python μέσω του .NET προσφέρει μεγάλο αριθμό πλήρως αυτοματοποιημένων και χειροκίνητων φίλτρων επεξεργασίας εικόνας που ενισχύουν μια εικόνα πριν αποσταλεί στον κινητήρα OCR:

Περιστρέφονται αυτόματα ανάποδα και περιστρεφόμενες εικόνες.
Ανίχνευση ανεστραμμένων εικόνων και εξαγωγή λευκού σε μαύρο κείμενο.
Αφαιρέστε αυτόματα τη βρωμιά, τις κηλίδες, τις γρατζουνιές, την αντανάκλαση, τις ανεπιθύμητες κλίσεις και τον άλλο θόρυβο.
Ρυθμίστε αυτόματα την αντίθεση της εικόνας.
Αυτόματα αναβαθμισμένα ή με το χέρι αλλάζουν το μέγεθος της εικόνας.
Μετατρέψτε τις εικόνες σε ασπρόμαυρο ή σε κλίμακα του γκρι.
Βρείτε δυνητικά προβληματικές περιοχές της εικόνας και επιστρέψτε τις πληροφορίες σχετικά με τον τύπο του ελαττώματος και τις συντεταγμένες του.
Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
Θορυβώδεις εικόνες θορυβώδους διατηρώντας τα άκρα των γραμμάτων.
Ικανοποιήστε την καμπυλότητα της σελίδας και διορθώστε την παραμόρφωση του φακού της κάμερας για φωτογραφίες σελίδας.

Βελτιστοποιημένο για συγκεκριμένους τύπους εγγράφων

Το Aspose OCR για το Python μέσω του .NET προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:

Ενσωματωμένος ορθογραφικός έλεγχος

Παρόλο που η βιβλιοθήκη Python OCR παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυποποιημένες γραμματοσειρές μπορεί να προκαλέσουν εσφαλμένα ορισμένους χαρακτήρες ή λέξεις. Για να βελτιώσετε περαιτέρω τα αποτελέσματα αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα ορθογραφικά σφάλματα με βάση την επιλεγμένη γλώσσα αναγνώρισης.

Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντομογραφίες και άλλες λέξεις που δεν υπάρχουν σε κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.

Αναγνώριση παρτίδας

Το API Python OCR σας απελευθερώνει από την αναγνώριση των εικόνων ένα προς ένα. Χρησιμοποιήστε διάφορες μεθόδους επεξεργασίας παρτίδων για να αναγνωρίσετε πολλαπλές εικόνες σε μία κλήση:

Αναγνώριση αρχείων πολλαπλών σελίδων PDF, TIFF και DJVU.
Αναγνώριση όλων των αρχείων σε ένα φάκελο.
Αναγνώριση όλων των αρχείων σε ένα αρχείο.
Αναγνώριση όλων των αρχείων από μια λίστα.

Μάθηση με δείγμα

Το OCR για την Python παρέχει μια σειρά από παραδείγματα γραμμένο στην Python, επιτρέποντάς σας να γνωρίσετε γρήγορα τον εαυτό σας με τις λειτουργίες και τις δυνατότητές του. Αποκτήστε πληροφορίες για τη δημιουργία προσαρμοσμένων λύσεων για να καλύψετε τις επιχειρηματικές σας ανάγκες στο Python.

Χαρακτηριστικά και δυνατότητες

Aspose.OCR for Python via .NET Aspose.ocr για Python μέσω .net επιλύει τις εργασίες σας γρήγορα και εύκολα.

Φωτογραφία OCR

Εξαγάγετε κείμενο από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.

Pdf που μπορεί να αναζητηθεί

Μετατρέψτε οποιαδήποτε σάρωση σε ένα πλήρως αναζητήσιμο, ευρετήριο και επεξεργάσιμο έγγραφο.

Αναγνώριση διεύθυνσης URL

Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.

Αναγνώριση χύδην

Διαβάστε όλες τις εικόνες από έγγραφα πολλαπλών σελίδων, φακέλους και αρχεία.

Οποιαδήποτε γραμματοσειρά και στυλ

Προσδιορίστε και αναγνωρίζετε το κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.

Αναγνώριση τελειοποίησης

Ρυθμίστε κάθε παράμετρο OCR για τα καλύτερα αποτελέσματα αναγνώρισης.

Ορθογραφικός έλεγχος

Βελτιώστε τα αποτελέσματα με αυτόματα τη διόρθωση των ορθογραφικών λέξεων.

Βρείτε κείμενο σε εικόνες

Αναζητήστε κείμενο ή κανονική έκφραση μέσα σε ένα σύνολο εικόνων.

Συγκρίνετε κείμενα εικόνας

Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.

Δείγματα κώδικα Python

Βυθίστε τα δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το OCR στις εφαρμογές Python.

Εγκατάσταση

Διανέμεται ως τροχός Python ή αυτόνομο πακέτο λήψης, Aspose.ocr για Python μέσω .NET διανέμεται εύκολα. Η ενσωμάτωση στο έργο Python, απευθείας από το προτιμώμενο περιβάλλον ανάπτυξης Python (IDE), είναι μια απρόσκοπτη διαδικασία. Απλά εγκαταστήστε το και είστε διατεθειμένοι να αξιοποιήσετε το πλήρες φάσμα των δυνατοτήτων OCR, η εξοικονόμηση αναγνώρισης έχει ως αποτέλεσμα διάφορες μορφές. Μια προσωρινή άδεια ανυψώνει όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, επιτρέποντάς σας να λάβετε τεκμηριωμένη απόφαση σχετικά με την αγορά ASPOSE.OCR για την Python μέσω του .NET σε μεταγενέστερο στάδιο.

Άδεια φόρτωσης

lic = License()
lic.set_license(self.licPath)

Αναγνωρίστε το κείμενο στις φωτογραφίες

Η ανάγνωση κειμένου από οποιοδήποτε περιεχόμενο στο ASPOSE OCR για την Python είναι τόσο εύκολη όσο η κλήση μιας μεθόδου καθολικής αναγνώρισης.

Μετατρέψτε τη φωτογραφία σε κείμενο - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

Το API μας διαβάζει δεξιότητα οποιασδήποτε εικόνας από σαρωτές, κάμερες ή smartphones: έγγραφα PDF, JPEG, PNG, TIFF, GIF, εικόνες BMP και ακόμη και αρχεία DJVU. Η πλήρης υποστήριξη για τα έγγραφα πολλαπλών σελίδων PDF, οι εικόνες TIFF και DJVU εξασφαλίζουν την ευελιξία. Μπορείτε επίσης να δώσετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.

Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.

Αναγνωρίστε το PDF και αποθηκεύστε τα αποτελέσματα σε διάφορες μορφές εξόδου - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Βελτιστοποίηση πόρων στο Python

Η αναγνώριση οπτικού χαρακτήρα απαιτεί πόρους. Το API μας προσφέρει ευέλικτους τρόπους εξισορρόπησης της κλασικής Triad Quality Triad:

Επιλέξτε μεταξύ της διεξοδικής αναγνώρισης και της γρήγορης αναγνώρισης.
Καθορίστε τον αριθμό των νημάτων που διατίθενται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
Ελευθερώστε την CPU με την εκφόρτωση υπολογισμών στο .NET Backend.

Γρήγορη αναγνώριση - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Αναγνωρίστε μεμονωμένη γραμμή

Εάν η εικόνα σας έχει ήδη κοπεί σε μία μόνο γραμμή κειμένου, μπορεί να αναγνωριστεί στην ταχύτερη δυνατή λειτουργία, χωρίς αυτοματοποιημένες διορθώσεις, ανίχνευση δομής περιεχομένου και άλλα βήματα που καταναλώνουν πόρους. Μπορεί να επιταχύνει το OCR έως και 7 φορές ταχύτερα από την κανονική διαδικασία αναγνώρισης.

Αναγνωρίστε την ενιαία γραμμή κειμένου στην εικόνα - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)

Βιβλιοθήκη Python OCR

Μετατρέψτε τις εικόνες σε κείμενο με Python OCR

Γιατί το Aspose.ocr για την Python μέσω του .net;

Αποτελεσματικό και ακριβές OCR

Πολύγλωσσος

Παγκόσμιος

Ασιατικές γλώσσες

Διατήρηση της διάταξης

Δείγμα ζωντανού κώδικα

Μετατρέψτε την εικόνα σε κείμενο

Επιλέξτε την προτίμησή σας

Ευστροφία

Ομοιομορφία

Εκτέλεση

Τρέχει παντού

Υποστηριζόμενες μορφές αρχείων

Εικόνες

Παρτίδα OCR

Αποτελέσματα αναγνώρισης

Εγκατάσταση

OCR κάτω από Python

140+ γλώσσες αναγνώρισης

Ισχυρά φίλτρα επεξεργασίας

Βελτιστοποιημένο για συγκεκριμένους τύπους εγγράφων

Ενσωματωμένος ορθογραφικός έλεγχος

Αναγνώριση παρτίδας

Μάθηση με δείγμα

Χαρακτηριστικά και δυνατότητες

Δείγματα κώδικα Python

Εγκατάσταση

Άδεια φόρτωσης

Αναγνωρίστε το κείμενο στις φωτογραφίες

Μετατρέψτε τη φωτογραφία σε κείμενο - Python

Python Universal Converter

Αναγνωρίστε το PDF και αποθηκεύστε τα αποτελέσματα σε διάφορες μορφές εξόδου - Python

Βελτιστοποίηση πόρων στο Python

Γρήγορη αναγνώριση - Python

Αναγνωρίστε μεμονωμένη γραμμή

Αναγνωρίστε την ενιαία γραμμή κειμένου στην εικόνα - Python

Έτοιμος, σετ, πηγαίνετε!

Υποστήριξη και μάθηση

Εξερευνήστε το API

Αποκτήστε υποστήριξη

Απελευθερώνει