Python-OCR-Bibliothek
Konvertieren Sie Bilder mit Python OCR in Text
Weitere Vitrinen ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Warum Aspose.OCR für Python über .NET?
Begeben Sie sich auf eine Reise mit Aspose OCR für Python über .NET – einer vielseitigen und benutzerfreundlichen OCR-API. Integrieren Sie die OCR-Funktionalität in Ihre Python-Anwendungen mit weniger als fünf Codezeilen, sodass keine komplexen mathematischen oder neuronalen Netze erforderlich sind. Unsere leistungsstarke OCR-Engine bietet beispiellose Geschwindigkeit und Genauigkeit und unterstützt mehr als 130 Sprachen, darunter Englisch, Kyrillisch, Arabisch, Persisch, Hindi, Chinesisch, Japanisch, Koreanisch, Tamilisch und viele mehr. Ob gescannte Bilder, Smartphone-Fotos, Screenshots oder gescannte PDFs – erhalten Sie Ergebnisse in gängigen Dokument- und Datenaustauschformaten. Nutzen Sie Vorverarbeitungsfilter, um gedrehte, verzerrte und verrauschte Bilder zu verarbeiten.
Effiziente und präzise OCR
Erleben Sie beispiellose Geschwindigkeit und Präzision bei OCR-Ergebnissen mit fortschrittlicher Python-Technologie.
Mehrsprachig
Erkennen Sie Texte in über 140 Sprachen: Englisch, Französisch, Deutsch, Spanisch, Russisch, Chinesisch, Hindi, Japanisch, Koreanisch, Tamilisch, Arabisch, Persisch und mehr.
Universal
Verarbeiten Sie mühelos Bilder aus verschiedenen Quellen – Scannern, Kameras und Smartphones – mit Python.
Asiatische Sprachen
Erzielen Sie eine präzise Erkennung chinesischer, arabischer, devanagariischer und dravidischer Schriften sowie gemischtsprachiger Texte.
Layout beibehalten
Behalten Sie die Quellformatierung für eine genaue Textdarstellung bei und erkennen Sie Tabellen.
Live-Codebeispiel
Konvertieren Sie ein Bild in nur DREI Zeilen Python-Code in Text. Versuchen Sie es selbst!
* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.
Bild in Text umwandeln
Entdecken Sie weitere Beispiele ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wählen Sie Ihre Präferenz
Wählen Sie die richtige Bibliothek für Ihre Bedürfnisse. Entdecken Sie die verfügbaren APIs und ihre Funktionen, um die effizienteste Lösung auszuwählen.
Vielseitigkeit
Python via .NET
Gleichmäßigkeit
Python via Java
Leistung
Python via C++
Läuft überall
Unabhängig vom Namen erfordert Aspose.OCR für Python über .NET keine Installation von .NET auf der Zielplattform. Das Installationspaket enthält bereits alle erforderlichen Komponenten und kann problemlos auf jeder Plattform betrieben werden – sei es ein lokaler Computer, ein Webserver oder die Cloud.
Unterstützte Dateiformate
Aspose.OCR for Python via .NET kann mit jeder [Datei]arbeiten( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.
Bilder
- JPEG
- PNG
- TIFF
- BMP
- GIF
Batch-OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Anerkennungsergebnisse
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation
Aspose.OCR für Python über .NET wird als Python-Paket mit minimalen Abhängigkeiten oder als herunterladbare Datei oder [PyPI-Paket](https: //pypi.org/project/aspose-ocr-python-net/). Installieren Sie es einfach in Ihr Projekt, und schon sind Sie bereit, Texte in über 140 Sprachen zu erkennen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.
Fordern Sie eine Testlizenz an , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.
OCR unter Python
Unsere Bibliothek lässt sich problemlos integrieren und ermöglicht die nahtlose Ausführung von Python-Anwendungen auf jeder Plattform – Desktop-Windows, Windows Server, macOS, Linux und der Cloud.
Über 140 Erkennungssprachen
Unsere Java-OCR-Bibliothek ist eine universelle Lösung für die Dokumentenverarbeitung, Datenextraktion und Inhaltsdigitalisierung auf globaler Ebene. Da es eine Vielzahl europäischer, nahöstlicher und asiatischer Schreibskripte unterstützt, eignet es sich für jedes Land und jedes Unternehmen.
Aspose OCR für Java erkennt Text in mehrsprachigen Dokumenten wie Chinesisch/Englisch, Arabisch/Französisch oder Kyrillisch/Englisch. Folgende Sprachen werden unterstützt:
- Erweitertes Latein: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und über 80 weitere;
- Kyrillisches Alphabet: Russisch, Ukrainisch, Kasachisch, Bulgarisch, einschließlich gemischter kyrillischer/englischer Texte;
- Arabisch, Persisch, Urdu, einschließlich mit Englisch gemischter Texte;
- Chinesisch, Koreanisch, Japanisch, Devanagari und dravidische Sprachen, einschließlich Hindi, Tamil, Marathi und andere. Auch gemischtsprachige Texte werden unterstützt.
Leistungsstarke Verarbeitungsfilter
Die Genauigkeit und Zuverlässigkeit der optischen Zeichenerkennung hängt stark von der Qualität des Originalbildes ab. Aspose OCR für Python über .NET bietet eine große Anzahl vollautomatischer und manueller Bildverarbeitungsfilter, die ein Bild verbessern, bevor es an die OCR-Engine gesendet wird:
- Auf den Kopf gestellte und gedrehte Bilder automatisch drehen.
- Erkennen Sie invertierte Bilder und extrahieren Sie Weiß-auf-Schwarz-Text.
- Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendungen, unerwünschte Farbverläufe und andere Geräusche.
- Passen Sie den Bildkontrast automatisch an.
- Automatisches Hochskalieren oder manuelle Größenänderung des Bildes.
- Konvertieren Sie Bilder in Schwarzweiß oder Graustufen.
- Finden Sie potenziell problematische Bildbereiche und geben Sie Informationen über die Art des Fehlers und seine Koordinaten zurück.
- Erhöhen Sie die Dicke der Zeichen in einem Bild.
- Machen Sie verrauschte Bilder unscharf und bewahren Sie gleichzeitig die Ränder der Buchstaben.
- Begradigen Sie die Seitenkrümmung und korrigieren Sie die Verzerrung des Kameraobjektivs für Seitenfotos.
Optimiert für bestimmte Dokumenttypen
Aspose OCR für Python über .NET bietet speziell trainierte neuronale Netze, um Text aus bestimmten Bildtypen mit maximaler Genauigkeit zu extrahieren:
Integrierte Rechtschreibprüfung
Obwohl unsere Python-OCR-Bibliothek eine hohe Erkennungsgenauigkeit bietet, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Rechtschreibprüfung aktivieren, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.
Wenn der erkannte Text Fachterminologie, Abkürzungen und andere Wörter enthält, die in gängigen Rechtschreibwörterbüchern nicht vorkommen, können Sie Ihre eigenen Wortlisten bereitstellen.
Chargenerkennung
Unsere Python-OCR-API befreit Sie davon, Bilder einzeln zu erkennen. Nutzen Sie verschiedene Stapelverarbeitungsmethoden, um mehrere Bilder in einem Aufruf zu erkennen:
- Erkennung mehrseitiger PDF-, TIFF- und DjVu-Dateien.
- Erkennung aller Dateien in einem Ordner.
- Erkennung aller Dateien in einem Archiv.
- Erkennung aller Dateien aus einer Liste.
Lernen nach Muster
OCR für Python bietet eine Reihe von in Python geschriebenen Beispielen , sodass Sie sich schnell mit seinen Funktionen und Fähigkeiten vertraut machen können. Gewinnen Sie Erkenntnisse für die Erstellung maßgeschneiderter Lösungen, die Ihren Python-Geschäftsanforderungen gerecht werden.
Funktionen und Fähigkeiten
Aspose.OCR for Python via .NET löst Ihre Aufgaben schnell und einfach.
Foto-OCR
Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.
Durchsuchbares PDF
Wandeln Sie jeden Scan in ein vollständig durchsuchbares, indizierbares und bearbeitbares Dokument um.
URL-Erkennung
Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.
Massenerkennung
Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.
Beliebige Schriftart und Stil
Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.
Feinabstimmung der Erkennung
Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.
Rechtschreibprüfung
Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.
Finden Sie Text in Bildern
Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.
Vergleichen Sie Bildtexte
Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.
Python-Codebeispiele
Tauchen Sie ein in Codebeispiele, um OCR nahtlos in Ihre Python-Anwendungen zu integrieren.
Installation
Aspose.OCR für Python wird als Python Wheel oder als eigenständiges herunterladbares Paket verteilt und lässt sich problemlos über .NET verteilen. Die Integration in Ihr Python-Projekt direkt aus Ihrer bevorzugten integrierten Python-Entwicklungsumgebung (IDE) ist ein nahtloser Prozess. Installieren Sie es einfach und schon können Sie das gesamte Spektrum der OCR-Funktionen nutzen und Erkennungsergebnisse in verschiedenen Formaten speichern.
Nach der Installation können Sie Aspose.OCR für Python über .NET umgehend verwenden , wenn auch mit gewissen Einschränkungen. Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie diese Zeit, um mit der Entwicklung einer voll funktionsfähigen OCR-Anwendung zu beginnen, sodass Sie zu einem späteren Zeitpunkt eine fundierte Entscheidung über den Kauf von Aspose.OCR für Python über .NET treffen können.
Lizenz laden
lic = License()
lic.set_license(self.licPath)
Erkennen Sie Text auf Fotos
Das Lesen von Text aus beliebigen Inhalten in Aspose OCR für Python ist so einfach wie das Aufrufen einer universellen Erkennungsmethode.
Foto in Text umwandeln – Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python-Universalkonverter
Unsere API liest problemlos jedes Bild von Scannern, Kameras oder Smartphones: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF-, BMP-Bilder und sogar DjVu-Dateien. Volle Unterstützung für mehrseitige PDF-Dokumente, TIFF und DjVu-Bilder sorgt für Vielseitigkeit. Sie können ein Bild auch aus dem Internet über eine URL bereitstellen.
Erkennungsergebnisse werden in gängigen Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.
PDF erkennen und Ergebnisse in verschiedenen Ausgabeformaten speichern – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Ressourcenoptimierung in Python
Die optische Zeichenerkennung erfordert Ressourcen. Unsere API bietet flexible Möglichkeiten, den klassischen Zeit-Preis-Qualitäts-Dreiklang auszubalancieren:
- Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
- Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
- Entlasten Sie die CPU, indem Sie Berechnungen in das .NET-Backend verlagern.
Schnelle Erkennung – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Einzelne Zeile erkennen
Wenn Ihr Bild bereits auf eine einzelne Textzeile zugeschnitten ist, kann es im schnellstmöglichen Modus erkannt werden, ohne automatische Korrekturen, Erkennung der Inhaltsstruktur und andere ressourcenintensive Schritte. Es kann die OCR bis zu siebenmal schneller beschleunigen als ein normaler Erkennungsprozess.
Erkennen Sie eine einzelne Textzeile im Bild – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)