Python OCR -Bibliothek
Umwandeln Sie Bilder mit Python OCR in Text
Weitere Showcases ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Warum ASPOSPE.OCR für Python über .NET?
Machen Sie eine Reise mit ASSOSE OCR für Python über .NET-eine vielseitige und benutzerfreundliche OCR-API. Einbetten Sie die OCR -Funktionalität in Ihre Python -Anwendungen mit weniger als 5 Codezeilen ein und beseitigen Sie die Notwendigkeit komplexer mathematischer oder neuronaler Netzwerke. Unser leistungsstarker OCR -Motor liefert eine unvergleichliche Geschwindigkeit und Genauigkeit und unterstützt über 140 Sprachen, darunter Englisch, Kyrillisch, Arabisch, Persisch, Hindi, Chinesisch, Japanisch, Koreanisch, Tamilisch und vieles mehr. Egal, ob es sich um gescannte Bilder, Smartphone -Fotos, Screenshots oder gescannte PDFs handelt, die Ergebnisse in beliebten Dokumenten- und Datenaustauschformaten erhalten. Nutzen Sie die Vorverarbeitungsfilter, um gedrehte, verzerrte und laute Bilder zu verarbeiten.

Effiziente und präzise OCR
Erleben Sie beispiellose Geschwindigkeit und Präzision in den OCR -Ergebnissen mit fortschrittlicher Python -Technologie.
Mehrsprachig
Erkennen Sie Text in 140 Sprachen: Englisch, Französisch, Deutsch, Spanisch, Russisch, Chinesisch, Hindi, Japanisch, Koreanisch, Tamilisch, Arabisch, Persisch und mehr.
Universal
Verarbeiten Sie mühelos Bilder aus verschiedenen Quellen - Scanner, Kameras und Smartphones - mit Python.
Asiatische Sprachen
Genauige Anerkennung chinesischer, arabischer, devanagari- und dravidischer Skripte sowie gemischte Texte erhalten.
Layout erhalten
Verwalten Sie die Quellformatierung für genaue Textdarstellung und erkennen Sie Tabellen.
Live -Code -Beispiel
Konvertieren Sie ein Bild in nur drei Zeilen von Python -Code in Text. Versuchen Sie es selbst!
* Durch Hochladen Ihrer Dateien oder die Verwendung des Dienstes, den Sie mit unserer zustimmen Nutzungsbedingungen Und Datenschutzrichtlinie.
Bild in Text konvertieren
Entdecken Sie weitere Beispiele ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wählen Sie Ihre Präferenz
Wählen Sie die richtige Bibliothek für Ihre Bedürfnisse. Entdecken Sie die verfügbaren APIs und deren Funktionen, um die effizienteste Lösung auszuwählen.
Vielseitigkeit
Python via .NET
Gleichmäßigkeit
Python via Java
Leistung
Python via C++
Läuft überall
Unabhängig vom Namen ist ASSON.OCR für Python über .NET nicht erforderlich, dass .NET auf der Zielplattform installiert werden muss. Das Installationspaket wird bereits mit allen erforderlichen Komponenten geliefert und kann nahtlos auf jeder Plattform arbeiten - sei es ein lokaler Computer, ein Webserver oder die Cloud.
Unterstützte Dateiformate
Aspose.OCR for Python via .NET kann mit jeder [Datei]funktionieren( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.
Bilder
- JPEG
- PNG
- TIFF
- BMP
- GIF
Batch OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Erkennungsergebnisse
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation
ASSON.OCR für Python über .NET wird als Python-Paket mit minimalen Abhängigkeiten oder als herunterladbare Datei oder Pypi-Paket geliefert. Einfach Installation IT in Ihr Projekt, und Sie sind bereit, Texte in über 140 Sprachen zu erkennen und Erkennungsergebnisse in verschiedenen Formaten zu sparen.
Anfordern einer Testlizenz , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.
OCR unter Python
Unsere Bibliothek integriert sich leicht und ermöglicht es Python -Anwendungen, nahtlos auf jeder Plattform auszuführen - Desktop -Windows, Windows Server, MacOS, Linux und Cloud.
140+ Erkennungssprachen
Unsere Java -OCR -Bibliothek ist eine universelle Lösung für die Verarbeitung, Datenextraktion und die Inhaltsdigitalisierung auf globaler Ebene. Mit Unterstützung für eine Vielzahl europäischer, mittlerer Ost- und asiatischer Schreibskripte ist es für jedes Land und jedes Unternehmen gut angepasst.
ASSOSE OCR für Java erkennt Text in mehrsprachigen Dokumenten wie chinesisch/englisch, arabisch/französisch oder kyrillisch/englisch. Die folgenden Sprachen werden unterstützt:
- ** erweitertes Latein **: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und 80+ mehr;
- ** Kyrillisch ** Alphabet: Russisch, Ukrainisch, Kasachisch, Bulgarisch, einschließlich gemischter kyrillischer/englischer Texte;
- Arabisch, Persisch, Urdu, einschließlich mit Englisch gemischtes Texte;
- Chinesisch, Koreanisch, Japanisch, Devanagari und dravidische Sprachen, einschließlich Hindi, Tamil, Marathi und anderen. Es werden ebenfalls gemischte Texte unterstützt.
Leistungsstarke Verarbeitungsfilter
Die Genauigkeit und Zuverlässigkeit der Erkennung der optischen Charaktere hängt stark von der Qualität des Originalbildes ab. ASSOSE OCR für Python über .NET bietet eine große Anzahl vollständig automatisierter und manueller Bildverarbeitungsfilter, die ein Bild verbessern, bevor es an die OCR -Engine gesendet wird:
- Drehen Sie automatisch verkehrte und gedrehte Bilder.
- Erkennen Sie umgekehrte Bilder und extrahieren Sie Weiß-auf-Schwarz-Text.
- Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendung, unerwünschte Gradienten und andere Geräusche.
- Passen Sie den Bildkontrast automatisch an.
- Automatisch hochwertig oder die Größe des Bildes manuell ändern.
- Umwandeln Sie Bilder in Schwarzweiß oder Graustufen.
- Finden Sie potenziell problematische Bildbereiche und geben Sie die Informationen über die Art des Defekts und deren Koordinaten zurück.
- Erhöhen Sie die Dicke der Zeichen in einem Bild.
- Verschwommener Bilder, während sie die Ränder der Buchstaben bewahren.
- Seitenkrümmung begradigen und die Verzerrung der Kameraobjektiv für Seitenfotos beheben.
Optimiert für bestimmte Dokumenttypen
ASSOSE OCR für Python über .NET bietet speziell ausgebildete neuronale Netzwerke, um Text aus bestimmten Bildern mit maximaler Genauigkeit zu extrahieren:
Eingebaute Zaubersprüche
Obwohl unsere Python-OCR-Bibliothek eine hohe Erkennungsgenauigkeit bietet, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Zauberprüfung einschalten, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.
Wenn der anerkannte Text spezielle Terminologie, Abkürzungen und andere Wörter enthält, die nicht in gemeinsamen Rechtschreibwörterbüchern vorhanden sind, können Sie Ihre eigenen Wortlisten bereitstellen.
Batch -Anerkennung
Unsere Python -OCR -API befreit Sie von der Erkennung von Bildern nacheinander. Verwenden Sie verschiedene Batch-Verarbeitungsmethoden, um mehrere Bilder in einem Aufruf zu erkennen:
- Erkennung von mehrseitigen PDF-, TIFF- und DJVU-Dateien.
- Erkennung aller Dateien in einem Ordner.
- Erkennung aller Dateien in einem Archiv.
- Erkennung aller Dateien aus einer Liste.
Lernen durch Probe
OCR für Python bietet eine Reihe von Beispielen in Python, sodass Sie sich schnell mit seinen Funktionen und Fähigkeiten kennenlernen können. Gewinnen Sie Erkenntnisse, um maßgeschneiderte Lösungen zu erstellen, um Ihre geschäftlichen Bedürfnisse der Python zu erfüllen.
Funktionen und Fähigkeiten
Aspose.OCR for Python via .NET ASSON.OCR für Python über .NET löst Ihre Aufgaben schnell und einfach.
Foto OCR
Text aus Smartphone-Fotos mit Genauigkeit auf Scanebene extrahieren.
Durchsuchbarer PDF
Konvertieren Sie jeden Scan in ein vollständig durchsuchbares, indexierbares und bearbeitbares Dokument.
URL -Anerkennung
Erkennen Sie ein Bild von URL, ohne es lokal herunterzuladen.
Massenerkennung
Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.
Jede Schriftart und jeder Stil
Identifizieren und erkennen Sie Text in allen beliebten Schriftarten und Stilen.
Fein-Tune-Anerkennung
Passen Sie jeden OCR -Parameter für die besten Erkennungsergebnisse an.
Zaubersprüche
Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.
Suchen Sie Text in Bildern
Suchen Sie nach Text oder regulärem Ausdruck in einem Satz von Bildern.
Vergleichen Sie Bildtexte
Vergleichen Sie Texte auf zwei Bildern, unabhängig von Fall und Layout.
Python -Code -Beispiele
Tauchen Sie in Code -Samples ein, um OCR nahtlos in Ihre Python -Anwendungen zu integrieren.
Installation
Als Python-Rad oder in sich geschlossenes herunterladbares Paket verteilt. Die Integration in Ihr Python -Projekt, direkt aus Ihrer bevorzugten Python Integrated Development Environment (IDE), ist ein nahtloser Prozess. Installieren Sie es einfach und Sie sind bereit, die gesamte Spektrum der OCR-Funktionen zu nutzen und Erkennungsergebnisse in verschiedenen Formaten zu sparen. Eine temporäre Lizenz erhöht alle Testversionsbeschränkungen für die Testversion für 30 Tage. Verwenden Sie diesen Zeitraum, um die Entwicklung eines voll funktionsfähigen OCR -Antrags zu initiieren, sodass Sie eine fundierte Entscheidung über den Kauf von ASOSPLE.OCR für Python über .NET zu einem späteren Zeitpunkt treffen können.
Lizenz laden
lic = License()
lic.set_license(self.licPath)
Text auf Fotos erkennen
Das Lesen von Text aus jeglichen Inhalten in Asposes OCR für Python ist so einfach wie eine universelle Erkennungsmethode.
Foto in Text konvertieren - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
Unsere API liest jedes Bild von Scannern, Kameras oder Smartphones: PDF -Dokumente, JPEG, PNG, TIFF, GIF, BMP -Bilder und sogar DJVU -Dateien. Die vollständige Unterstützung für mehrseitige PDF-Dokumente, TIFF- und DJVU-Bilder gewährleistet die Vielseitigkeit. Sie können über eine URL auch ein Bild aus dem Web bereitstellen.
Erkennungsergebnisse werden in beliebten Dokumenten- und Datenaustauschformaten zurückgegeben: Klartext, PDF, Microsoft Word, Microsoft Excel, JSON und XML.
Erkennen Sie PDF und speichern Sie die Ergebnisse in verschiedenen Ausgangsformaten - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Ressourcenoptimierung in Python
Die Anerkennung der optischen Charaktere erfordert Ressourcen. Unsere API bietet flexible Möglichkeiten, um die klassische Triade in zeitspreiswerter Qualität in Einklang zu bringen:
- Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
- Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder erlauben Sie der Bibliothek, automatisch auf die Anzahl der Prozessorkerne zu skalieren.
- Befreien Sie sich die CPU, indem Sie Berechnungen in das .NET -Backend abladen.
Schnelle Anerkennung - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Einzellinie erkennen
Wenn Ihr Bild bereits in eine einzelne Textzeile getrimmt ist, kann es im schnellsten Modus ohne automatisierte Korrekturen, Erkennung von Inhalten und andere ressourcenverbrauchende Schritte erkannt werden. Es kann den OCR bis zu 7 -mal schneller beschleunigen als der normale Erkennungsprozess.
Erkennen Sie eine einzelne Textzeile auf dem Bild - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)