Konvertieren Sie Bilder mit der Python-OCR-API über Java in Text
Erkennen Sie Text in Bildern mit Python
Weitere Vitrinen ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Warum Aspose.OCR für Python über Java?
Aspose.OCR für Python über Java integriert leistungsstarke OCR-Funktionen (Optical Character Recognition) nahtlos in Ihre plattformübergreifenden Python-Notebooks und -Anwendungen. Mit unserer intuitiven und schnellen API können Sie mühelos Text aus Scans, Screenshots, Weblinks oder Smartphone-Fotos extrahieren und so Ergebnisse liefern, die zur Konsolidierung, Analyse oder Speicherung bereit sind. Erkennen Sie gescannte Bilder, Smartphone-Fotos, Screenshots und gescannte PDFs und speichern Sie die Ergebnisse in gängigen Dokumentformaten. Erweiterte Vorverarbeitungsfilter verarbeiten gedrehte, verzerrte und verrauschte Bilder. Optimieren Sie die Leistung, indem Sie Aufgaben auf die GPU verlagern.
Schnelle und genaue OCR
Erzielen Sie schnelle und genaue OCR-Ergebnisse mit unserer fortschrittlichen Python-über-Java-Technologie.
Mehrsprachiger Support
Erkennen Sie Texte in über 130 Sprachen, darunter lateinische, kyrillische, arabische, persische, indische und chinesische Schriftzeichen, und sorgen Sie so für Vielseitigkeit für Ihre Python-Anwendungen über Java.
Flexible Bildunterstützung
Verarbeiten Sie Bilder von Scannern, Kameras und Smartphones nahtlos mit Python über Java.
Präzision bei der Erkennung chinesischer Schriftzeichen
Erkennen Sie über Java präzise über 6.000 chinesische Schriftzeichen in Ihren Python-Projekten.
Behalten Sie Schriftstile und Formatierungen bei
Behalten Sie Schriftstile und Formatierungen bei, um erkannten Text in Ihren Python-Anwendungen über Java genau darzustellen.
Live-Codebeispiel
Starten Sie die Texterkennung anhand von Bildern in nur drei Codezeilen. Erleben Sie die Einfachheit!
* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.
Bild in Text umwandeln
Weitere Beispiele ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wählen Sie Ihre Präferenz
Wählen Sie die richtige Bibliothek für Ihre Bedürfnisse. Entdecken Sie die verfügbaren APIs und ihre Funktionen, um die effizienteste Lösung auszuwählen.
Vielseitigkeit
Python via .NET
Gleichmäßigkeit
Python via Java
Leistung
Python via C++
Java-Backend-Kompatibilität
Unsere Bibliothek ist als Python-Modul konzipiert und gewährleistet die Kompatibilität mit allen gängigen Betriebssystemen, die Java unterstützen – einschließlich Microsoft Windows, Linux und macOS Cloud-Plattformen. Dadurch können Sie Anwendungen auf einer Plattform entwickeln und nahtlos auf einer anderen ausführen, ohne dass Codeänderungen erforderlich sind.
Unterstützte Dateiformate
Aspose.OCR for Python via Java kann mit jeder [Datei]arbeiten( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.
Bilder
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Batch-OCR
- Multi-page PDF
- ZIP
- Folder
Anerkennungsergebnisse
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Mühelose Installation für Python über Java
Aspose.OCR für Python über Java wird als Python-Paket oder als herunterladbare Datei mit minimalen Abhängigkeiten geliefert. Installieren Sie es einfach in Ihr Projekt, und schon sind Sie bereit, Texte in mehreren unterstützten Sprachen zu erkennen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.
Fordern Sie eine Testlizenz an , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.
Leistungsstarke OCR für Python-Anwendungen
Unsere Bibliothek lässt sich problemlos integrieren und ermöglicht die nahtlose Ausführung von Python-Anwendungen auf jeder Plattform – Desktop-Windows, Windows Server, macOS, Linux und der Cloud.
Über 130 Erkennungssprachen
Unsere Python- und Java-OCR-API erkennt eine Vielzahl von Sprachen und gängigen Schreibskripten, einschließlich gemischter Sprachen:
Überlassen Sie die Spracherkennung der Bibliothek oder definieren Sie die Sprache selbst, um die Erkennungsleistung und Zuverlässigkeit zu verbessern.
- Erweitertes lateinisches Alphabet: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und über 80 weitere;
- Kyrillisches Alphabet: Russisch, Ukrainisch, Kasachisch, Serbisch, Weißrussisch, Bulgarisch;
- Arabisch, Persisch, Urdu;
- Chinesische und Devanagari-Schrift, einschließlich Hindi, Marathi, Bhojpuri und andere.
Verbesserte Bildverarbeitungsfilter
Die Präzision der optischen Zeichenerkennung hängt stark von der Qualität des Originalbildes ab. Aspose.OCR für Python über Java bietet eine breite Palette an automatischen und manuellen Bildverarbeitungsfiltern, um ein Bild vor der Übermittlung an die OCR-Engine zu optimieren:
- Richten Sie leicht geneigte Bilder automatisch gerade aus.
- Korrigieren Sie die Drehung stark verzerrter Bilder manuell.
- Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendungen, unerwünschte Farbverläufe und andere Arten von Geräuschen.
- Passen Sie den Bildkontrast automatisch an.
- Automatisches Hochskalieren oder manuelle Größenänderung des Bildes.
- Konvertieren Sie Bilder in Schwarzweiß oder Graustufen.
- Bildfarben umkehren, sodass helle Bereiche dunkel und dunkle Bereiche hell erscheinen.
- Erhöhen Sie die Dicke der Zeichen in einem Bild.
- Machen Sie verrauschte Bilder unscharf und bewahren Sie gleichzeitig die Buchstabenkanten.
- Begradigen Sie die Seitenschräge und korrigieren Sie die Verzerrung des Kameraobjektivs in Seitenfotos.
Spezifische APIs für verschiedene Dokumenttypen
Aspose.OCR für Python über Java bietet speziell trainierte neuronale Netze, um Text aus bestimmten Bildtypen mit höchster Genauigkeit zu extrahieren:
- Gescannte oder fotografierte Personalausweise und Reisepässe.
- Kfz-Kennzeichen.
- Rechnungen.
- Quittungen.
Integrierte Rechtschreibprüfung
Obwohl Aspose.OCR für Python über Java eine hohe Erkennungsgenauigkeit bietet, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Rechtschreibprüfung aktivieren, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.
Wenn der erkannte Text Fachterminologie, Abkürzungen und andere Wörter enthält, die in gängigen Rechtschreibwörterbüchern nicht vorkommen, können Sie Ihre eigenen Wortlisten bereitstellen.
Effiziente Chargenerkennung
Mit unserer Python-OCR-API können Sie die Bilderkennung optimieren. Nutzen Sie vielseitige Stapelverarbeitungsmethoden für die effiziente Verarbeitung mehrerer Bilder in einem einzigen Aufruf:
- Erkennen Sie mehrseitige PDF- und TIFF-Dateien.
- Verarbeiten Sie alle Dateien in einem Ordner.
- Behandelt die Erkennung aller Dateien in einem Archiv.
- Erkennen Sie Bilder aus einer angegebenen Liste.
Lernen anhand von Python-Beispielen
Entdecken Sie eine Vielzahl von Python-Beispielen , die Ihnen helfen sollen, die Funktionen und Fähigkeiten unserer OCR-Lösung schnell zu verstehen. Erhalten Sie schnell Einblicke in die Erstellung maßgeschneiderter Lösungen, die Ihren spezifischen Geschäftsanforderungen entsprechen.
Merkmale und Fähigkeiten
Aspose.OCR for Python via Java Entdecken Sie die erweiterten Funktionen von Aspose.OCR für Python
Foto-OCR
Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.
Durchsuchbares PDF
Wandeln Sie jeden Scan in ein vollständig durchsuchbares und indizierbares Dokument um.
URL-Erkennung
Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.
Massenerkennung
Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.
Beliebige Schriftart und Stil
Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.
Feinabstimmung der Erkennung
Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.
Rechtschreibprüfung
Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.
Finden Sie Text in Bildern
Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.
Vergleichen Sie Bildtexte
Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.
Python-Codebeispiele
Entdecken Sie Codebeispiele, um Aspose.OCR für Python über Java nahtlos in Ihre Anwendungen zu integrieren.
Mühelose Installation
Als Python-Paket oder herunterladbare Datei mit minimalen Abhängigkeiten gewährleistet Aspose.OCR für Python über Java eine einfache Verteilung. Integrieren Sie es direkt aus Python in Ihr Projekt, und Sie sind bereit, die vollständigen OCR-Funktionen zu nutzen und Erkennungsergebnisse in verschiedenen Formaten zu speichern.
Nach der Installation können Sie umgehend mit der Verwendung von Aspose.OCR für Python über Java beginnen. wenn auch mit gewissen Einschränkungen. Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie diese Zeit, um mit der Entwicklung einer voll funktionsfähigen OCR-Anwendung zu beginnen, damit Sie später eine fundierte Entscheidung über den Kauf von Aspose.OCR für Python über Java treffen können.
Lizenz laden
lic = License()
lic.set_license(self.licPath)
Bilderkennung
Die größte Herausforderung bei OCR-Anwendungen ist der Mangel an Scannern für Endbenutzer. Unsere API ist über Java nahtlos in Python integriert und verfügt über robuste integrierte Bildvorverarbeitungsfilter, die gedrehte, verzerrte und verrauschte Bilder verarbeiten. Kombiniert mit der Unterstützung aller Bildformate ermöglicht es eine zuverlässige Erkennung auch von Smartphone-Fotos. Die meisten Vorverarbeitungs- und Bildkorrekturen sind automatisiert und erfordern nur in schwierigen Fällen Ihr Eingreifen.
Automatische Bildkorrekturen anwenden – Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python-Universalkonverter
Unsere API liest problemlos jedes Bild von Scannern, Kameras oder Smartphones: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF- und BMP-Dateien. Volle Unterstützung für mehrseitige PDF-Dokumente, TIFF und DjVu-Bilder sorgt für Vielseitigkeit. Sie können ein Bild auch aus dem Internet über eine URL bereitstellen.
Erkennungsergebnisse werden in gängigen Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.
PDF erkennen und Ergebnisse in verschiedenen Ausgabeformaten speichern – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimierung der Ressourcennutzung
OCR bietet einen speziellen Erkennungsalgorithmus zum Extrahieren von Inhalten aus Bildern mit spärlichem Text und verrauschten/farbigen Hintergründen. Diese Methode verbessert die OCR-Genauigkeit in den folgenden Geschäftsfällen erheblich:
- Lesen Sie Text aus Straßenfotos.
- Segmentieren und identifizieren Sie Verkehrsschilder und Schilder in Straßenbildern.
- Suchen Sie nach Preisschildern und interpretieren Sie den extrahierten Text als Preise.
- Suchen und aggregieren Sie interessante Bereiche auf Lebensmitteletiketten, z. B. Nährwertangaben oder Zutatenlisten.
- Identifizieren und analysieren Sie Autokennzeichen.
- Extrahieren Sie Text aus Menüs und Katalogen.
OCR im offenen Bereich – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extrahieren von Text aus Straßenfotos
OCR für Python bietet einen speziellen Erkennungsalgorithmus, der Text aus Fahrzeugkennzeichen extrahiert, einschließlich dunkler und verschwommener Fotos. Der resultierende Text kann dann automatisch in der Datenbank gespeichert oder automatisch überprüft werden.
Autonummer erkennen – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)