OCR for Java

OCR for C++

OCR for Python via .NET

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via Java

OCR-Beherrschung in Python: Unterstützt von Aspose.OCR für Python über .NET

Integrieren Sie die optische Zeichenerkennung (OCR) nahtlos in Ihre Python-Anwendungen mit Aspose.OCR für Python über .NET. Wandeln Sie Bilder mühelos mit prägnantem Python-Code in Text um und erschließen Sie so eine Fülle erweiterter OCR-Funktionen.

Herunterladen Versuch Kaufen

Schau was neu ist

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-java or
download

Warum Aspose.OCR für Python über Java?

Aspose.OCR für Python über Java integriert leistungsstarke OCR-Funktionen (Optical Character Recognition) nahtlos in Ihre plattformübergreifenden Python-Notebooks und -Anwendungen. Mit unserer intuitiven und schnellen API können Sie mühelos Text aus Scans, Screenshots, Weblinks oder Smartphone-Fotos extrahieren und so Ergebnisse liefern, die zur Konsolidierung, Analyse oder Speicherung bereit sind. Erkennen Sie gescannte Bilder, Smartphone-Fotos, Screenshots und gescannte PDFs und speichern Sie die Ergebnisse in gängigen Dokumentformaten. Erweiterte Vorverarbeitungsfilter verarbeiten gedrehte, verzerrte und verrauschte Bilder. Optimieren Sie die Leistung, indem Sie Aufgaben auf die GPU verlagern.

Schnelle und genaue OCR

Erzielen Sie schnelle und genaue OCR-Ergebnisse mit unserer fortschrittlichen Python-über-Java-Technologie.

Mehrsprachiger Support

Erkennen Sie Text in 28 Sprachen, einschließlich lateinischer, kyrillischer und chinesischer Schrift, und sorgen Sie so für Vielseitigkeit für Ihre Python-Anwendungen über Java.

Flexible Bildunterstützung

Verarbeiten Sie Bilder von Scannern, Kameras und Smartphones nahtlos mit Python über Java.

Präzision bei der Erkennung chinesischer Schriftzeichen

Erkennen Sie über Java präzise über 6.000 chinesische Schriftzeichen in Ihren Python-Projekten.

Behalten Sie Schriftstile und Formatierungen bei

Behalten Sie Schriftstile und Formatierungen bei, um erkannten Text in Ihren Python-Anwendungen über Java genau darzustellen.

Live-Codebeispiel

Starten Sie die Texterkennung anhand von Bildern in nur drei Codezeilen. Erleben Sie die Einfachheit!

Bereit zu erkennen Bereit zu erkennen Legen Sie hier eine Datei ab oder klicken Sie zum Durchsuchen *

* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.

Erkennungsergebnis

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Java-Backend-Kompatibilität

Unsere Bibliothek ist als Python-Modul konzipiert und gewährleistet die Kompatibilität mit allen gängigen Betriebssystemen, die Java unterstützen – einschließlich Microsoft Windows, Linux und macOS Cloud-Plattformen. Dadurch können Sie Anwendungen auf einer Plattform entwickeln und nahtlos auf einer anderen ausführen, ohne dass Codeänderungen erforderlich sind.

Unterstützte Dateiformate

Aspose.OCR for Python via Java kann mit praktisch jeder [Datei]arbeiten( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse werden in den gängigsten Datei- und Datenaustauschformaten zurückgegeben, die gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden können.

Bilder

PDF
JPEG
PNG
TIFF
GIF
Bitmap

Batch-OCR

Multi-page PDF
ZIP
Folder

Anerkennungsergebnisse

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Mühelose Installation für Python über Java

Aspose.OCR für Python über Java wird als Python-Paket oder als herunterladbare Datei mit minimalen Abhängigkeiten geliefert. Installieren Sie es einfach in Ihr Projekt, und schon sind Sie bereit, Texte in mehreren unterstützten Sprachen zu erkennen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.

Fordern Sie eine Testlizenz an , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.

Leistungsstarke OCR für Python-Anwendungen

Unsere Bibliothek lässt sich problemlos integrieren und ermöglicht die nahtlose Ausführung von Python-Anwendungen auf jeder Plattform – Desktop-Windows, Windows Server, macOS, Linux und der Cloud.

28 Erkennungssprachen

Unsere Python- und Java-OCR-API erkennt eine Vielzahl von Sprachen und gängigen Schreibskripten, einschließlich gemischter Sprachen:

Überlassen Sie die Spracherkennung der Bibliothek oder definieren Sie die Sprache selbst, um die Erkennungsleistung und Zuverlässigkeit zu verbessern.

Erweitertes lateinisches Alphabet: Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch;
Kyrillisches Alphabet: Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch;
Chinesisch: Über 6.000 Zeichen;
Hindi.

Verbesserte Bildverarbeitungsfilter

Die Präzision der optischen Zeichenerkennung hängt stark von der Qualität des Originalbildes ab. Aspose.OCR für Python über Java bietet eine breite Palette an automatischen und manuellen Bildverarbeitungsfiltern, um ein Bild vor der Übermittlung an die OCR-Engine zu optimieren:

Richten Sie leicht geneigte Bilder automatisch gerade aus.
Korrigieren Sie die Drehung stark verzerrter Bilder manuell.
Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendungen, unerwünschte Farbverläufe und andere Arten von Geräuschen.
Passen Sie den Bildkontrast automatisch an.
Automatisches Hochskalieren oder manuelle Größenänderung des Bildes.
Konvertieren Sie Bilder in Schwarzweiß oder Graustufen.
Bildfarben umkehren, sodass helle Bereiche dunkel und dunkle Bereiche hell erscheinen.
Erhöhen Sie die Dicke der Zeichen in einem Bild.
Machen Sie verrauschte Bilder unscharf und bewahren Sie gleichzeitig die Buchstabenkanten.
Begradigen Sie die Seitenschräge und korrigieren Sie die Verzerrung des Kameraobjektivs in Seitenfotos.

Spezifische APIs für verschiedene Dokumenttypen

Aspose.OCR für Python über Java bietet speziell trainierte neuronale Netze, um Text aus bestimmten Bildtypen mit höchster Genauigkeit zu extrahieren:

Gescannte oder fotografierte Personalausweise und Reisepässe.
Kfz-Kennzeichen.
Rechnungen.
Quittungen.

Integrierte Rechtschreibprüfung

Obwohl Aspose.OCR für Python über Java eine hohe Erkennungsgenauigkeit bietet, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Rechtschreibprüfung aktivieren, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.

Wenn der erkannte Text Fachterminologie, Abkürzungen und andere Wörter enthält, die in gängigen Rechtschreibwörterbüchern nicht vorkommen, können Sie Ihre eigenen Wortlisten bereitstellen.

Effiziente Chargenerkennung

Mit unserer Python-OCR-API können Sie die Bilderkennung optimieren. Nutzen Sie vielseitige Stapelverarbeitungsmethoden für die effiziente Verarbeitung mehrerer Bilder in einem einzigen Aufruf:

Erkennen Sie mehrseitige PDF- und TIFF-Dateien.
Verarbeiten Sie alle Dateien in einem Ordner.
Behandelt die Erkennung aller Dateien in einem Archiv.
Erkennen Sie Bilder aus einer angegebenen Liste.

Lernen anhand von Python-Beispielen

Entdecken Sie eine Vielzahl von Python-Beispielen , die Ihnen helfen sollen, die Funktionen und Fähigkeiten unserer OCR-Lösung schnell zu verstehen. Erhalten Sie schnell Einblicke in die Erstellung maßgeschneiderter Lösungen, die Ihren spezifischen Geschäftsanforderungen entsprechen.

Merkmale und Fähigkeiten

Aspose.OCR for Python via Java Entdecken Sie die erweiterten Funktionen von Aspose.OCR für Python

Foto-OCR

Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.

Durchsuchbares PDF

Wandeln Sie jeden Scan in ein vollständig durchsuchbares und indizierbares Dokument um.

URL-Erkennung

Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.

Massenerkennung

Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.

Beliebige Schriftart und Stil

Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.

Feinabstimmung der Erkennung

Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.

Rechtschreibprüfung

Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.

Finden Sie Text in Bildern

Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.

Vergleichen Sie Bildtexte

Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.

Python-Codebeispiele

Entdecken Sie Codebeispiele, um Aspose.OCR für Python über Java nahtlos in Ihre Anwendungen zu integrieren.

Mühelose Installation

Als Python-Paket oder herunterladbare Datei mit minimalen Abhängigkeiten gewährleistet Aspose.OCR für Python über Java eine einfache Verteilung. Integrieren Sie es direkt aus Python in Ihr Projekt, und Sie sind bereit, die vollständigen OCR-Funktionen zu nutzen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.

Nach der Installation können Sie umgehend mit der Verwendung von Aspose.OCR für Python über Java beginnen. wenn auch mit gewissen Einschränkungen. Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie diese Zeit, um mit der Entwicklung einer voll funktionsfähigen OCR-Anwendung zu beginnen, damit Sie später eine fundierte Entscheidung über den Kauf von Aspose.OCR für Python über Java treffen können.

Lizenz laden

lic = License()
lic.set_license(self.licPath)

Bilderkennung

Die größte Herausforderung bei OCR-Anwendungen ist der Mangel an Scannern für Endbenutzer. Unsere API ist über Java nahtlos in Python integriert und verfügt über robuste integrierte Bildvorverarbeitungsfilter, die gedrehte, verzerrte und verrauschte Bilder verarbeiten. Kombiniert mit der Unterstützung aller Bildformate ermöglicht es eine zuverlässige Erkennung auch von Smartphone-Fotos. Die meisten Vorverarbeitungs- und Bildkorrekturen sind automatisiert und erfordern nur in schwierigen Fällen Ihr Eingreifen.

Automatische Bildkorrekturen anwenden – Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python-Universalkonverter

Unsere API liest problemlos jedes Bild von Scannern, Kameras oder Smartphones: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF- und BMP-Dateien. Die vollständige Unterstützung für mehrseitige PDF-Dokumente, TIFF und DjVu-Bilder sorgt für Vielseitigkeit. Sie können ein Bild auch aus dem Internet über eine URL bereitstellen.

Erkennungsergebnisse werden in gängigen Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.

PDF erkennen und Ergebnisse in verschiedenen Ausgabeformaten speichern – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimierung der Ressourcennutzung

OCR bietet einen speziellen Erkennungsalgorithmus zum Extrahieren von Inhalten aus Bildern mit spärlichem Text und verrauschten/farbigen Hintergründen. Diese Methode verbessert die OCR-Genauigkeit in den folgenden Geschäftsfällen erheblich:

Lesen Sie Text aus Straßenfotos.
Segmentieren und identifizieren Sie Verkehrsschilder und Schilder in Straßenbildern.
Suchen Sie nach Preisschildern und interpretieren Sie den extrahierten Text als Preise.
Finden und aggregieren Sie interessante Bereiche auf Lebensmitteletiketten, z. B. Nährwertangaben oder Zutatenlisten.
Identifizieren und analysieren Sie Autokennzeichen.
Extrahieren Sie Text aus Menüs und Katalogen.

OCR im offenen Bereich – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extrahieren von Text aus Straßenfotos

OCR für Python bietet einen speziellen Erkennungsalgorithmus, der Text aus Fahrzeugkennzeichen extrahiert, einschließlich dunkler und verschwommener Fotos. Der resultierende Text kann dann automatisch in der Datenbank gespeichert oder automatisch überprüft werden.

Autonummer erkennen – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)