Γιατί να επιλέξετε το Aspose.OCR για Python μέσω .NET;

Ξεκινήστε ένα ταξίδι με το Aspose.OCR για Python μέσω .NET – ένα ευέλικτο και φιλικό προς τον χρήστη OCR API. Ενσωματώστε τη λειτουργικότητα OCR στις εφαρμογές σας Python με λιγότερες από 5 γραμμές κώδικα, εξαλείφοντας την ανάγκη για πολύπλοκα μαθηματικά ή νευρωνικά δίκτυα. Ο ισχυρός μας κινητήρας OCR προσφέρει απαράμιλλη ταχύτητα και ακρίβεια, υποστηρίζοντας 28 γλώσσες, συμπεριλαμβανομένων των λατινικών, κυριλλικών και κινεζικών σεναρίων. Είτε πρόκειται για σαρωμένες εικόνες, φωτογραφίες smartphone, στιγμιότυπα οθόνης ή σαρωμένα PDF, αποκτήστε αποτελέσματα σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων. Αξιοποιήστε τα φίλτρα προεπεξεργασίας για να χειριστείτε περιστρεφόμενες, λοξές και θορυβώδεις εικόνες. Βελτιστοποιήστε την απόδοση αναγνώρισης και τη φόρτωση του συστήματος μεταφορτώνοντας εργασίες με ένταση πόρων στο backend .NET.

Illustration ocr

Αποτελεσματική και ακριβής μαεστρία OCR

Απολαύστε απαράμιλλη ταχύτητα και ακρίβεια στα αποτελέσματα OCR με την προηγμένη τεχνολογία Python και .NET.

Πολυγλωσσική Αριστεία

Αναγνωρίστε κείμενο σε 28 γλώσσες, που εκτείνονται σε λατινικά, κυριλλικά και κινέζικα σενάρια με ευκολία και ακρίβεια.

Προσαρμόσιμη επεξεργασία εικόνας

Επεξεργαστείτε εύκολα εικόνες από διάφορες πηγές –σαρωτές, κάμερες και smartphones– χρησιμοποιώντας Python και .NET.

Ικανότητα κινέζικου χαρακτήρα

Επιτύχετε ακριβή αναγνώριση πάνω από 6.000 κινεζικών χαρακτήρων, εξασφαλίζοντας ακρίβεια με Python και .NET.

Διατήρηση στυλ γραμματοσειρών και μορφών

Διατηρήστε τα στυλ γραμματοσειράς και τη μορφοποίηση για ακριβή αναπαράσταση κειμένου, βελτιώνοντας την ευελιξία με Python και .NET.

Ζωντανό δείγμα κώδικα

Ζήστε την απλότητα: Μετατρέψτε μια εικόνα σε κείμενο σε τρεις μόνο γραμμές κώδικα Python!

Έτοιμος να αναγνωρίσει Έτοιμος να αναγνωρίσει Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για περιήγηση *

* Ανεβάζοντας τα αρχεία σας ή χρησιμοποιώντας την υπηρεσία συμφωνείτε με εμάς Οροι χρήσης και Πολιτική Απορρήτου.

Αποτέλεσμα αναγνώρισης
 

Μετατροπή εικόνας σε κείμενο

Ανακαλύψτε περισσότερα παραδείγματα >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

.NET Empowerment για Python σε κάθε γωνία

Το Aspose.OCR για Python μέσω .NET λειτουργεί απρόσκοπτα σε οποιαδήποτε πλατφόρμα που υποστηρίζει .NET Framework 4.0 και μεταγενέστερη έκδοση – είτε πρόκειται για τοπικό μηχάνημα, web διακομιστή ή το σύννεφο.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Υποστηριζόμενες μορφές αρχείων

Aspose.OCR for Python via .NET μπορεί να λειτουργήσει με σχεδόν οποιοδήποτε αρχείο μπορείτε να πάρετε από έναν σαρωτή ή μια κάμερα. Τα αποτελέσματα αναγνώρισης επιστρέφονται στις πιο δημοφιλείς μορφές ανταλλαγής αρχείων και δεδομένων που μπορούν να αποθηκευτούν, να εισαχθούν σε μια βάση δεδομένων ή να αναλυθούν σε πραγματικό χρόνο.

εικόνες

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Παρτίδα OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Αποτελέσματα αναγνώρισης

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Εγκατάσταση για Python με .NET backend

Το Aspose.OCR για Python μέσω .NET παραδίδεται ως πακέτο Python με ελάχιστες εξαρτήσεις ή ως αρχείο με δυνατότητα λήψης . εγκαταστήστε εύκολα στο έργο σας και είστε έτοιμοι να αναγνωρίσετε κείμενα σε πολλές υποστηριζόμενες γλώσσες και να αποθηκεύσετε αποτελέσματα αναγνώρισης σε διάφορες μορφές.

Ζητήστε μια δοκιμαστική άδεια για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR χωρίς περιορισμούς.

Ισχυρό OCR για εφαρμογές Python

Η βιβλιοθήκη μας ενσωματώνεται εύκολα, επιτρέποντας στις εφαρμογές Python να εκτελούνται απρόσκοπτα σε οποιαδήποτε πλατφόρμα – επιτραπέζιους υπολογιστές Windows, Windows Server, macOS, Linux και cloud.

28 Γλώσσες αναγνώρισης

Το Python και το .NET OCR API μας αναγνωρίζει μια πληθώρα γλωσσών και δημοφιλών σεναρίων γραφής, συμπεριλαμβανομένων μικτών γλωσσών:

Αφήστε τον εντοπισμό γλώσσας στη βιβλιοθήκη ή ορίστε τη γλώσσα μόνοι σας για βελτιωμένη απόδοση αναγνώρισης και αξιοπιστία.

  • Εκτεταμένο λατινικό αλφάβητο: Κροατικά, Τσέχικα, Δανικά, Ολλανδικά, Αγγλικά, Εσθονικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ιταλικά, Λετονικά, Λιθουανικά, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Σλοβακικά, Σλοβενικά, Ισπανικά, Σουηδικά.
  • Κυριλλικό αλφάβητο: Λευκορωσικά, Βουλγαρικά, Καζακικά, Ρωσικά, Σερβικά, Ουκρανικά.
  • Κινέζικα: Πάνω από 6.000 χαρακτήρες.
  • Χίντι.

Ισχυρά φίλτρα επεξεργασίας

Η ακρίβεια και η αξιοπιστία της οπτικής αναγνώρισης χαρακτήρων εξαρτάται σε μεγάλο βαθμό από την ποιότητα της αρχικής εικόνας. Το Aspose.OCR για Python μέσω .NET προσφέρει έναν μεγάλο αριθμό πλήρως αυτοματοποιημένων και μη αυτόματων φίλτρων επεξεργασίας εικόνας που βελτιώνουν μια εικόνα πριν σταλεί στη μηχανή OCR:

  • Αυτόματη ευθυγράμμιση εικόνων που είναι ευθυγραμμισμένες σε μια μικρή γωνία προς την οριζόντια.
  • Χειροκίνητη περιστροφή πολύ λοξών εικόνων.
  • Αφαιρέστε αυτόματα τη βρωμιά, τις κηλίδες, τις γρατσουνιές, τη λάμψη, τις ανεπιθύμητες κλίσεις και άλλους θορύβους.
  • Προσαρμόστε αυτόματα την αντίθεση της εικόνας.
  • Αυτόματη αναβάθμιση ή μη αυτόματη αλλαγή μεγέθους της εικόνας.
  • Μετατροπή εικόνων σε ασπρόμαυρες ή σε κλίμακα του γκρι.
  • Αντιστρέψτε τα χρώματα της εικόνας έτσι ώστε οι φωτεινές περιοχές να φαίνονται σκοτεινές και οι σκοτεινές περιοχές να εμφανίζονται ανοιχτές.
  • Αυξήστε το πάχος των χαρακτήρων σε μια εικόνα.
  • Θολώστε τις θορυβώδεις εικόνες διατηρώντας τις άκρες των γραμμάτων.
  • Ισιώστε την καμπυλότητα της σελίδας και διορθώστε την παραμόρφωση του φακού της κάμερας για φωτογραφίες σελίδας.

Βελτιστοποιημένο για συγκεκριμένους τύπους εγγράφων

Το Aspose.OCR για Python μέσω .NET προσφέρει ειδικά εκπαιδευμένα νευρωνικά δίκτυα για την εξαγωγή κειμένου από ορισμένους τύπους εικόνων με μέγιστη ακρίβεια:

Ενσωματωμένος ορθογραφικός έλεγχος

Παρόλο που το Aspose.OCR για Python μέσω .NET παρέχει υψηλή ακρίβεια αναγνώρισης, τα ελαττώματα εκτύπωσης, η βρωμιά ή οι μη τυπικές γραμματοσειρές ενδέχεται να έχουν ως αποτέλεσμα την εσφαλμένη αναγνώριση ορισμένων χαρακτήρων ή λέξεων. Για περαιτέρω βελτίωση των αποτελεσμάτων αναγνώρισης, μπορείτε να ενεργοποιήσετε τον ορθογραφικό έλεγχο, ο οποίος βρίσκει και διορθώνει αυτόματα τα ορθογραφικά λάθη με βάση την επιλεγμένη γλώσσα αναγνώρισης.

Εάν το αναγνωρισμένο κείμενο περιέχει εξειδικευμένη ορολογία, συντομογραφίες και άλλες λέξεις που δεν υπάρχουν στα κοινά λεξικά ορθογραφίας, μπορείτε να παρέχετε τις δικές σας λίστες λέξεων.

Απλοποιημένη αναγνώριση παρτίδας

Το Python OCR API σας απελευθερώνει από την αναγνώριση εικόνων μία προς μία. Χρησιμοποιήστε διάφορες μεθόδους επεξεργασίας παρτίδας για την αναγνώριση πολλαπλών εικόνων σε μία κλήση:

  • Αναγνώριση πολυσέλιδων αρχείων PDF, TIFF και DjVu.
  • Αναγνώριση όλων των αρχείων σε ένα φάκελο.
  • Αναγνώριση όλων των αρχείων σε ένα αρχείο.
  • Αναγνώριση όλων των αρχείων από μια λίστα.

Παραδείγματα εκμάθησης μέσω Python

Το Aspose.OCR για Python μέσω .NET παρέχει μια σειρά από παραδείγματα γραμμένα σε Python, επιτρέποντάς σας να εξοικειωθείτε γρήγορα με τις λειτουργίες του και δυνατότητες. Αποκτήστε πληροφορίες για τη δημιουργία προσαρμοσμένων λύσεων για να καλύψετε τις επιχειρηματικές σας ανάγκες Python.

Χαρακτηριστικά και Δυνατότητες

Aspose.OCR for Python via .NET Εξερευνήστε τις προηγμένες δυνατότητες του Aspose.OCR για C++.

Feature icon

Φωτογραφία OCR

Εξαγωγή κειμένου από φωτογραφίες smartphone με ακρίβεια σε επίπεδο σάρωσης.

Feature icon

PDF με δυνατότητα αναζήτησης

Μετατρέψτε οποιαδήποτε σάρωση σε ένα έγγραφο με πλήρη αναζήτηση και ευρετηρίαση.

Feature icon

Αναγνώριση URL

Αναγνωρίστε μια εικόνα από τη διεύθυνση URL χωρίς να την κατεβάσετε τοπικά.

Feature icon

Μαζική αναγνώριση

Διαβάστε όλες τις εικόνες από έγγραφα πολλών σελίδων, φακέλους και αρχεία.

Feature icon

Οποιαδήποτε γραμματοσειρά και στυλ

Προσδιορίστε και αναγνωρίστε κείμενο σε όλες τις δημοφιλείς γραμματοσειρές και στυλ.

Feature icon

Αναγνώριση με ακρίβεια

Προσαρμόστε κάθε παράμετρο OCR για καλύτερα αποτελέσματα αναγνώρισης.

Feature icon

Ορθογραφικός έλεγχος

Βελτιώστε τα αποτελέσματα διορθώνοντας αυτόματα τις ανορθόγραφες λέξεις.

Feature icon

Βρείτε κείμενο σε εικόνες

Αναζήτηση κειμένου ή κανονικής έκφρασης μέσα σε ένα σύνολο εικόνων.

Feature icon

Συγκρίνετε κείμενα εικόνων

Συγκρίνετε κείμενα σε δύο εικόνες, ανεξάρτητα από την περίπτωση και τη διάταξη.

Δείγματα κώδικα Python

Ερευνήστε σε δείγματα κώδικα για να ενσωματώσετε απρόσκοπτα το Aspose.OCR για Python μέσω .NET στις εφαρμογές Python σας.

Επιδεξιότητα εγκατάστασης σε Python

Διανέμεται ως Python Wheel ή αυτόνομο πακέτο με δυνατότητα λήψης, το Aspose.OCR για Python μέσω .NET διανέμεται εύκολα. Η ενσωμάτωση στο έργο Python σας, απευθείας από το προτιμώμενο περιβάλλον ανάπτυξης Python (IDE), είναι μια απρόσκοπτη διαδικασία. Απλώς εγκαταστήστε το και είστε έτοιμοι να αξιοποιήσετε το πλήρες φάσμα των δυνατοτήτων OCR, αποθηκεύοντας αποτελέσματα αναγνώρισης σε διάφορες μορφές.

Μετά την εγκατάσταση, μπορείτε να ξεκινήσετε αμέσως τη χρήση του Aspose.OCR για Python μέσω .NET , αν και με ορισμένους περιορισμούς. Μια προσωρινή άδεια αίρει όλους τους περιορισμούς της δοκιμαστικής έκδοσης για 30 ημέρες. Χρησιμοποιήστε αυτήν την περίοδο για να ξεκινήσετε την ανάπτυξη μιας πλήρως λειτουργικής εφαρμογής OCR, η οποία σας επιτρέπει να λάβετε μια τεκμηριωμένη απόφαση για την αγορά του Aspose.OCR για Python μέσω .NET σε μεταγενέστερο στάδιο.

Φόρτωση άδειας

lic = License()
lic.set_license(self.licPath)

Αναγνώριση κειμένου στις Φωτογραφίες

Η ανάγνωση κειμένου από οποιοδήποτε περιεχόμενο στο Aspose.OCR για Python μέσω .NET είναι τόσο εύκολη όσο η κλήση μιας μεθόδου καθολικής αναγνώρισης().

Μετατροπή φωτογραφίας σε κείμενο - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

Το API μας διαβάζει επιδέξια οποιαδήποτε εικόνα από σαρωτές, κάμερες ή smartphone: έγγραφα PDF, JPEG, PNG, TIFF, GIF, εικόνες BMP, ακόμη και αρχεία DjVu. Η πλήρης υποστήριξη για έγγραφα PDF πολλών σελίδων, εικόνες TIFF και DjVu εξασφαλίζει ευελιξία. Μπορείτε επίσης να παρέχετε μια εικόνα από τον ιστό μέσω μιας διεύθυνσης URL.

Τα αποτελέσματα αναγνώρισης επιστρέφονται σε δημοφιλείς μορφές ανταλλαγής εγγράφων και δεδομένων: απλό κείμενο, PDF, Microsoft Word, Microsoft Excel, JSON και XML.

Αναγνώριση PDF και αποθήκευση αποτελεσμάτων σε διάφορες μορφές εξόδου - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Βελτιστοποίηση πόρων στην Python

Η οπτική αναγνώριση χαρακτήρων απαιτεί πόρους. Το API μας προσφέρει ευέλικτους τρόπους εξισορρόπησης της κλασικής τριάδας χρόνου-τιμής-ποιότητας:

  • Επιλέξτε ανάμεσα σε πλήρη αναγνώριση και γρήγορη αναγνώριση.
  • Καθορίστε τον αριθμό των νημάτων που εκχωρούνται για αναγνώριση ή επιτρέψτε στη βιβλιοθήκη να κλιμακωθεί αυτόματα στον αριθμό των πυρήνων του επεξεργαστή.
  • Απελευθερώστε τη CPU μεταφορτώνοντας τους υπολογισμούς στο backend .NET.

Γρήγορη αναγνώριση - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Αναγνωρίστε μια γραμμή

Εάν η εικόνα σας έχει ήδη περικοπεί σε μία γραμμή κειμένου, μπορεί να αναγνωριστεί με την ταχύτερη δυνατή λειτουργία, χωρίς αυτοματοποιημένες διορθώσεις, ανίχνευση δομής περιεχομένου και άλλα βήματα που καταναλώνουν πόρους. Μπορεί να επιταχύνει το OCR έως και 7 φορές πιο γρήγορα από την κανονική διαδικασία αναγνώρισης.

Αναγνώριση μιας γραμμής κειμένου στην εικόνα - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)