OCR-Beherrschung in Python: Unterstützt von Aspose.OCR für Python über .NET
OCR: Bilder mit Python in Text umwandeln
Weitere Vitrinen ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Warum sollten Sie sich für Aspose.OCR für Python über .NET entscheiden?
Begeben Sie sich auf eine Reise mit Aspose.OCR für Python über .NET – einer vielseitigen und benutzerfreundlichen OCR-API. Integrieren Sie die OCR-Funktionalität in Ihre Python-Anwendungen mit weniger als fünf Codezeilen, sodass keine komplexen mathematischen oder neuronalen Netze erforderlich sind. Unsere leistungsstarke OCR-Engine bietet beispiellose Geschwindigkeit und Genauigkeit und unterstützt 28 Sprachen, darunter lateinische, kyrillische und chinesische Schriften. Ob gescannte Bilder, Smartphone-Fotos, Screenshots oder gescannte PDFs – erhalten Sie Ergebnisse in gängigen Dokument- und Datenaustauschformaten. Nutzen Sie Vorverarbeitungsfilter, um gedrehte, verzerrte und verrauschte Bilder zu verarbeiten. Optimieren Sie die Erkennungsleistung und die Systemlast, indem Sie ressourcenintensive Aufgaben auf das .NET-Backend verlagern.
Effiziente und präzise OCR-Beherrschung
Erleben Sie beispiellose Geschwindigkeit und Präzision bei OCR-Ergebnissen mit fortschrittlicher Python- und .NET-Technologie.
Mehrsprachige Exzellenz
Erkennen Sie Texte in 28 Sprachen, darunter lateinische, kyrillische und chinesische Schriften, einfach und präzise.
Anpassbare Bildverarbeitung
Verarbeiten Sie mühelos Bilder aus verschiedenen Quellen – Scannern, Kameras und Smartphones – mit Python und .NET.
Kenntnisse der chinesischen Schriftzeichen
Erzielen Sie eine präzise Erkennung von über 6.000 chinesischen Schriftzeichen und sorgen Sie mit Python und .NET für Genauigkeit.
Erhaltung von Schriftarten und -formaten
Behalten Sie Schriftarten und Formatierungen für eine genaue Textdarstellung bei und erhöhen Sie so die Vielseitigkeit mit Python und .NET.
Live-Codebeispiel
Erleben Sie Einfachheit: Konvertieren Sie ein Bild in Text in nur drei Zeilen Python-Code!
* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.
Bild in Text umwandeln
Entdecken Sie weitere Beispiele ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
.NET-Unterstützung für Python in jeder Ecke
Aspose.OCR für Python über .NET funktioniert nahtlos auf jeder Plattform, die [.NET Framework 4.0 und höher]unterstützt ( https://docs.aspose.com/ocr/net/system-requirements/ ) – sei es ein lokaler Computer oder ein Web Server oder die Cloud.
Unterstützte Dateiformate
Aspose.OCR for Python via .NET kann mit praktisch jeder [Datei]arbeiten( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse werden in den gängigsten Datei- und Datenaustauschformaten zurückgegeben, die gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden können.
Bilder
- JPEG
- PNG
- TIFF
- BMP
- GIF
Batch-OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Anerkennungsergebnisse
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation für Python mit .NET-Backend
Aspose.OCR für Python über .NET wird als Python-Paket mit minimalen Abhängigkeiten oder als herunterladbare Datei bereitgestellt. Installieren Sie es einfach in Ihr Projekt, und schon sind Sie bereit, Texte in mehreren unterstützten Sprachen zu erkennen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.
Fordern Sie eine Testlizenz an , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.
Leistungsstarke OCR für Python-Anwendungen
Unsere Bibliothek lässt sich problemlos integrieren und ermöglicht die nahtlose Ausführung von Python-Anwendungen auf jeder Plattform – Desktop-Windows, Windows Server, macOS, Linux und der Cloud.
28 Erkennungssprachen
Unsere Python- und .NET-OCR-API erkennt eine Vielzahl von Sprachen und gängigen Schreibskripten, einschließlich gemischter Sprachen:
Überlassen Sie die Spracherkennung der Bibliothek oder definieren Sie die Sprache selbst, um die Erkennungsleistung und Zuverlässigkeit zu verbessern.
- Erweitertes lateinisches Alphabet: Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch;
- Kyrillisches Alphabet: Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch;
- Chinesisch: Über 6.000 Zeichen;
- Hindi.
Leistungsstarke Verarbeitungsfilter
Die Genauigkeit und Zuverlässigkeit der optischen Zeichenerkennung hängt stark von der Qualität des Originalbildes ab. Aspose.OCR für Python über .NET bietet eine große Anzahl vollautomatischer und manueller Bildverarbeitungsfilter, die ein Bild verbessern, bevor es an die OCR-Engine gesendet wird:
- Richten Sie Bilder, die in einem leichten Winkel zur Horizontalen ausgerichtet sind, automatisch gerade aus.
- Drehen Sie stark verzerrte Bilder manuell.
- Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendungen, unerwünschte Farbverläufe und andere Geräusche.
- Passen Sie den Bildkontrast automatisch an.
- Automatisches Hochskalieren oder manuelle Größenänderung des Bildes.
- Konvertieren Sie Bilder in Schwarzweiß oder Graustufen.
- Bildfarben umkehren, sodass helle Bereiche dunkel und dunkle Bereiche hell erscheinen.
- Erhöhen Sie die Dicke der Zeichen in einem Bild.
- Machen Sie verrauschte Bilder unscharf und bewahren Sie gleichzeitig die Kanten der Buchstaben.
- Begradigen Sie die Seitenkrümmung und korrigieren Sie die Verzerrung des Kameraobjektivs für Seitenfotos.
Optimiert für bestimmte Dokumenttypen
Aspose.OCR für Python über .NET bietet speziell trainierte neuronale Netze, um Text aus bestimmten Bildtypen mit maximaler Genauigkeit zu extrahieren:
Integrierte Rechtschreibprüfung
Obwohl Aspose.OCR für Python über .NET eine hohe Erkennungsgenauigkeit bietet, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Rechtschreibprüfung aktivieren, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.
Wenn der erkannte Text Fachterminologie, Abkürzungen und andere Wörter enthält, die in gängigen Rechtschreibwörterbüchern nicht vorkommen, können Sie Ihre eigenen Wortlisten bereitstellen.
Vereinfachte Chargenerkennung
Unsere Python-OCR-API befreit Sie davon, Bilder einzeln zu erkennen. Nutzen Sie verschiedene Stapelverarbeitungsmethoden, um mehrere Bilder in einem Aufruf zu erkennen:
- Erkennung mehrseitiger PDF-, TIFF- und DjVu-Dateien.
- Erkennung aller Dateien in einem Ordner.
- Erkennung aller Dateien in einem Archiv.
- Erkennung aller Dateien aus einer Liste.
Lernen durch Python-Beispiele
Aspose.OCR für Python über .NET bietet eine Reihe von in Python geschriebenen Beispielen , sodass Sie sich schnell mit seinen Funktionen vertraut machen können und Fähigkeiten. Gewinnen Sie Erkenntnisse für die Erstellung maßgeschneiderter Lösungen, die Ihren Python-Geschäftsanforderungen gerecht werden.
Merkmale und Fähigkeiten
Aspose.OCR for Python via .NET Entdecken Sie die erweiterten Funktionen von Aspose.OCR für C++.
Foto-OCR
Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.
Durchsuchbares PDF
Wandeln Sie jeden Scan in ein vollständig durchsuchbares und indizierbares Dokument um.
URL-Erkennung
Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.
Massenerkennung
Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.
Beliebige Schriftart und Stil
Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.
Feinabstimmung der Erkennung
Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.
Rechtschreibprüfung
Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.
Finden Sie Text in Bildern
Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.
Vergleichen Sie Bildtexte
Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.
Python-Codebeispiele
Tauchen Sie ein in Codebeispiele, um Aspose.OCR für Python über .NET nahtlos in Ihre Python-Anwendungen zu integrieren.
Beherrschung der Installation in Python
Aspose.OCR für Python wird als Python Wheel oder als eigenständiges herunterladbares Paket verteilt und lässt sich problemlos über .NET verteilen. Die Integration in Ihr Python-Projekt direkt aus Ihrer bevorzugten integrierten Python-Entwicklungsumgebung (IDE) ist ein nahtloser Prozess. Installieren Sie es einfach und schon können Sie die gesamte Palette der OCR-Funktionen nutzen und Erkennungsergebnisse in verschiedenen Formaten speichern.
Nach der Installation können Sie Aspose.OCR für Python über .NET umgehend verwenden , wenn auch mit gewissen Einschränkungen. Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie diese Zeit, um mit der Entwicklung einer voll funktionsfähigen OCR-Anwendung zu beginnen, sodass Sie zu einem späteren Zeitpunkt eine fundierte Entscheidung über den Kauf von Aspose.OCR für Python über .NET treffen können.
Lizenz laden
lic = License()
lic.set_license(self.licPath)
Erkennen Sie Text auf Fotos
Das Lesen von Text aus beliebigen Inhalten in Aspose.OCR für Python über .NET ist so einfach wie der Aufruf einer universellen Erkennungsmethode ().
Foto in Text umwandeln – Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python-Universalkonverter
Unsere API liest problemlos jedes Bild von Scannern, Kameras oder Smartphones: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF-, BMP-Bilder und sogar DjVu-Dateien. Die vollständige Unterstützung für mehrseitige PDF-Dokumente, TIFF und DjVu-Bilder sorgt für Vielseitigkeit. Sie können ein Bild auch aus dem Internet über eine URL bereitstellen.
Erkennungsergebnisse werden in gängigen Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.
PDF erkennen und Ergebnisse in verschiedenen Ausgabeformaten speichern – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Ressourcenoptimierung in Python
Die optische Zeichenerkennung erfordert Ressourcen. Unsere API bietet flexible Möglichkeiten, den klassischen Zeit-Preis-Qualitäts-Dreiklang auszubalancieren:
- Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
- Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
- Entlasten Sie die CPU, indem Sie Berechnungen in das .NET-Backend verlagern.
Schnelle Erkennung – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Einzelne Zeile erkennen
Wenn Ihr Bild bereits auf eine einzelne Textzeile zugeschnitten ist, kann es im schnellstmöglichen Modus erkannt werden, ohne automatische Korrekturen, Erkennung der Inhaltsstruktur und andere ressourcenintensive Schritte. Es kann die OCR bis zu siebenmal schneller beschleunigen als ein normaler Erkennungsprozess.
Erkennen Sie eine einzelne Textzeile im Bild – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)