Warum Aspose.OCR für Python über .NET?

Begeben Sie sich auf eine Reise mit Aspose OCR für Python über .NET – einer vielseitigen und benutzerfreundlichen OCR-API. Integrieren Sie die OCR-Funktionalität in Ihre Python-Anwendungen mit weniger als fünf Codezeilen, sodass keine komplexen mathematischen oder neuronalen Netze erforderlich sind. Unsere leistungsstarke OCR-Engine bietet beispiellose Geschwindigkeit und Genauigkeit und unterstützt mehr als 130 Sprachen, darunter Englisch, Kyrillisch, Arabisch, Persisch, Hindi, Chinesisch, Japanisch, Koreanisch, Tamilisch und viele mehr. Ob gescannte Bilder, Smartphone-Fotos, Screenshots oder gescannte PDFs – erhalten Sie Ergebnisse in gängigen Dokument- und Datenaustauschformaten. Nutzen Sie Vorverarbeitungsfilter, um gedrehte, verzerrte und verrauschte Bilder zu verarbeiten.

Illustration ocr

Effiziente und präzise OCR

Erleben Sie beispiellose Geschwindigkeit und Präzision bei OCR-Ergebnissen mit fortschrittlicher Python-Technologie.

Mehrsprachig

Erkennen Sie Texte in über 140 Sprachen: Englisch, Französisch, Deutsch, Spanisch, Russisch, Chinesisch, Hindi, Japanisch, Koreanisch, Tamilisch, Arabisch, Persisch und mehr.

Universal

Verarbeiten Sie mühelos Bilder aus verschiedenen Quellen – Scannern, Kameras und Smartphones – mit Python.

Asiatische Sprachen

Erzielen Sie eine präzise Erkennung chinesischer, arabischer, devanagariischer und dravidischer Schriften sowie gemischtsprachiger Texte.

Layout beibehalten

Behalten Sie die Quellformatierung für eine genaue Textdarstellung bei und erkennen Sie Tabellen.

Live-Codebeispiel

Konvertieren Sie ein Bild in nur DREI Zeilen Python-Code in Text. Versuchen Sie es selbst!

Bereit zu erkennen Bereit zu erkennen Legen Sie hier eine Datei ab oder klicken Sie zum Durchsuchen *

* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.

Erkennungsergebnis
 

Bild in Text umwandeln

Entdecken Sie weitere Beispiele >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Wählen Sie Ihre Präferenz

Wählen Sie die richtige Bibliothek für Ihre Bedürfnisse. Entdecken Sie die verfügbaren APIs und ihre Funktionen, um die effizienteste Lösung auszuwählen.

Vielseitigkeit

Python via .NET

Einfache Entwicklung, Lesbarkeit und Wartbarkeit des Codes
Bietet die meisten Funktionen und erhält die häufigsten Updates
Die Gesamtgeschwindigkeit ist möglicherweise etwas langsamer als bei anderen Plattformen

Gleichmäßigkeit

Python via Java

Verwenden Sie dieselbe Bibliothek auf jeder Plattform
Führen Sie Ihre Anwendung nahtlos auf jedem Gerät aus
Erfordert die Java Runtime Environment (JRE) Version 8 oder höher

Leistung

Python via C++

Die schnellstmögliche Geschwindigkeit unabhängig von der Plattform
Große Kontrolle über das Ressourcenmanagement
Zielgruppe sind erfahrene Entwickler

Läuft überall

Unabhängig vom Namen erfordert Aspose.OCR für Python über .NET keine Installation von .NET auf der Zielplattform. Das Installationspaket enthält bereits alle erforderlichen Komponenten und kann problemlos auf jeder Plattform betrieben werden – sei es ein lokaler Computer, ein Webserver oder die Cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Unterstützte Dateiformate

Aspose.OCR for Python via .NET kann mit jeder [Datei]arbeiten( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.

Bilder

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch-OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Anerkennungsergebnisse

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installation

Aspose.OCR für Python über .NET wird als Python-Paket mit minimalen Abhängigkeiten oder als herunterladbare Datei oder [PyPI-Paket](https: //pypi.org/project/aspose-ocr-python-net/). Installieren Sie es einfach in Ihr Projekt, und schon sind Sie bereit, Texte in über 140 Sprachen zu erkennen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.

Fordern Sie eine Testlizenz an , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.

OCR unter Python

Unsere Bibliothek lässt sich problemlos integrieren und ermöglicht die nahtlose Ausführung von Python-Anwendungen auf jeder Plattform – Desktop-Windows, Windows Server, macOS, Linux und der Cloud.

Über 140 Erkennungssprachen

Unsere Java-OCR-Bibliothek ist eine universelle Lösung für die Dokumentenverarbeitung, Datenextraktion und Inhaltsdigitalisierung auf globaler Ebene. Da es eine Vielzahl europäischer, nahöstlicher und asiatischer Schreibskripte unterstützt, eignet es sich für jedes Land und jedes Unternehmen.

Aspose OCR für Java erkennt Text in mehrsprachigen Dokumenten wie Chinesisch/Englisch, Arabisch/Französisch oder Kyrillisch/Englisch. Folgende Sprachen werden unterstützt:

  • Erweitertes Latein: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und über 80 weitere;
  • Kyrillisches Alphabet: Russisch, Ukrainisch, Kasachisch, Bulgarisch, einschließlich gemischter kyrillischer/englischer Texte;
  • Arabisch, Persisch, Urdu, einschließlich mit Englisch gemischter Texte;
  • Chinesisch, Koreanisch, Japanisch, Devanagari und dravidische Sprachen, einschließlich Hindi, Tamil, Marathi und andere. Auch gemischtsprachige Texte werden unterstützt.

Leistungsstarke Verarbeitungsfilter

Die Genauigkeit und Zuverlässigkeit der optischen Zeichenerkennung hängt stark von der Qualität des Originalbildes ab. Aspose OCR für Python über .NET bietet eine große Anzahl vollautomatischer und manueller Bildverarbeitungsfilter, die ein Bild verbessern, bevor es an die OCR-Engine gesendet wird:

  • Auf den Kopf gestellte und gedrehte Bilder automatisch drehen.
  • Erkennen Sie invertierte Bilder und extrahieren Sie Weiß-auf-Schwarz-Text.
  • Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendungen, unerwünschte Farbverläufe und andere Geräusche.
  • Passen Sie den Bildkontrast automatisch an.
  • Automatisches Hochskalieren oder manuelle Größenänderung des Bildes.
  • Konvertieren Sie Bilder in Schwarzweiß oder Graustufen.
  • Finden Sie potenziell problematische Bildbereiche und geben Sie Informationen über die Art des Fehlers und seine Koordinaten zurück.
  • Erhöhen Sie die Dicke der Zeichen in einem Bild.
  • Machen Sie verrauschte Bilder unscharf und bewahren Sie gleichzeitig die Ränder der Buchstaben.
  • Begradigen Sie die Seitenkrümmung und korrigieren Sie die Verzerrung des Kameraobjektivs für Seitenfotos.

Optimiert für bestimmte Dokumenttypen

Aspose OCR für Python über .NET bietet speziell trainierte neuronale Netze, um Text aus bestimmten Bildtypen mit maximaler Genauigkeit zu extrahieren:

Integrierte Rechtschreibprüfung

Obwohl unsere Python-OCR-Bibliothek eine hohe Erkennungsgenauigkeit bietet, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Rechtschreibprüfung aktivieren, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.

Wenn der erkannte Text Fachterminologie, Abkürzungen und andere Wörter enthält, die in gängigen Rechtschreibwörterbüchern nicht vorkommen, können Sie Ihre eigenen Wortlisten bereitstellen.

Chargenerkennung

Unsere Python-OCR-API befreit Sie davon, Bilder einzeln zu erkennen. Nutzen Sie verschiedene Stapelverarbeitungsmethoden, um mehrere Bilder in einem Aufruf zu erkennen:

  • Erkennung mehrseitiger PDF-, TIFF- und DjVu-Dateien.
  • Erkennung aller Dateien in einem Ordner.
  • Erkennung aller Dateien in einem Archiv.
  • Erkennung aller Dateien aus einer Liste.

Lernen nach Muster

OCR für Python bietet eine Reihe von in Python geschriebenen Beispielen , sodass Sie sich schnell mit seinen Funktionen und Fähigkeiten vertraut machen können. Gewinnen Sie Erkenntnisse für die Erstellung maßgeschneiderter Lösungen, die Ihren Python-Geschäftsanforderungen gerecht werden.

Funktionen und Fähigkeiten

Aspose.OCR for Python via .NET löst Ihre Aufgaben schnell und einfach.

Feature icon

Foto-OCR

Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.

Feature icon

Durchsuchbares PDF

Wandeln Sie jeden Scan in ein vollständig durchsuchbares, indizierbares und bearbeitbares Dokument um.

Feature icon

URL-Erkennung

Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.

Feature icon

Massenerkennung

Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.

Feature icon

Beliebige Schriftart und Stil

Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.

Feature icon

Feinabstimmung der Erkennung

Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.

Feature icon

Rechtschreibprüfung

Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.

Feature icon

Finden Sie Text in Bildern

Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.

Feature icon

Vergleichen Sie Bildtexte

Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.

Python-Codebeispiele

Tauchen Sie ein in Codebeispiele, um OCR nahtlos in Ihre Python-Anwendungen zu integrieren.

Installation

Aspose.OCR für Python wird als Python Wheel oder als eigenständiges herunterladbares Paket verteilt und lässt sich problemlos über .NET verteilen. Die Integration in Ihr Python-Projekt direkt aus Ihrer bevorzugten integrierten Python-Entwicklungsumgebung (IDE) ist ein nahtloser Prozess. Installieren Sie es einfach und schon können Sie das gesamte Spektrum der OCR-Funktionen nutzen und Erkennungsergebnisse in verschiedenen Formaten speichern.

Nach der Installation können Sie Aspose.OCR für Python über .NET umgehend verwenden , wenn auch mit gewissen Einschränkungen. Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie diese Zeit, um mit der Entwicklung einer voll funktionsfähigen OCR-Anwendung zu beginnen, sodass Sie zu einem späteren Zeitpunkt eine fundierte Entscheidung über den Kauf von Aspose.OCR für Python über .NET treffen können.

Lizenz laden

lic = License()
lic.set_license(self.licPath)

Erkennen Sie Text auf Fotos

Das Lesen von Text aus beliebigen Inhalten in Aspose OCR für Python ist so einfach wie das Aufrufen einer universellen Erkennungsmethode.

Foto in Text umwandeln – Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python-Universalkonverter

Unsere API liest problemlos jedes Bild von Scannern, Kameras oder Smartphones: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF-, BMP-Bilder und sogar DjVu-Dateien. Volle Unterstützung für mehrseitige PDF-Dokumente, TIFF und DjVu-Bilder sorgt für Vielseitigkeit. Sie können ein Bild auch aus dem Internet über eine URL bereitstellen.

Erkennungsergebnisse werden in gängigen Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.

PDF erkennen und Ergebnisse in verschiedenen Ausgabeformaten speichern – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Ressourcenoptimierung in Python

Die optische Zeichenerkennung erfordert Ressourcen. Unsere API bietet flexible Möglichkeiten, den klassischen Zeit-Preis-Qualitäts-Dreiklang auszubalancieren:

  • Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
  • Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
  • Entlasten Sie die CPU, indem Sie Berechnungen in das .NET-Backend verlagern.

Schnelle Erkennung – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Einzelne Zeile erkennen

Wenn Ihr Bild bereits auf eine einzelne Textzeile zugeschnitten ist, kann es im schnellstmöglichen Modus erkannt werden, ohne automatische Korrekturen, Erkennung der Inhaltsstruktur und andere ressourcenintensive Schritte. Es kann die OCR bis zu siebenmal schneller beschleunigen als ein normaler Erkennungsprozess.

Erkennen Sie eine einzelne Textzeile im Bild – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)