Konvertieren Sie Bild mit Python OCR -API über Java in Text
Erkennen Sie Text in Bildern mit Python
Weitere Showcases ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Warum ASPOST.OCR für Python über Java?
ASSON.OCR für Python über Java integriert nahtlos leistungsstarke Funktionen für optische Charaktererkennung (OCR) in Ihre plattformübergreifenden Python-Notizbücher und -Anwendungen. Mit unserer intuitiven und Hochgeschwindigkeits-API können Sie mühelos Text aus Scans, Screenshots, Weblinks oder Smartphone-Fotos extrahieren und Ergebnisse liefern, die für die Konsolidierung, Analyse oder Speicherung bereit sind. Erkennen Sie gescannte Bilder, Smartphone -Fotos, Screenshots und gescannte PDFs und speichern Sie Ergebnisse in beliebten Dokumentformaten. Fortgeschrittene Vorverarbeitungsfilter handeln gedrehte, verzerrte und laute Bilder. Optimieren Sie die Leistung, indem Sie Aufgaben in die GPU abladen.

Schnelle und genaue OCR
Erreichen Sie mit unserem fortschrittlichen Python über Java-Technologie Hochgeschwindigkeits- und genaue OCR-Ergebnisse.
Mehrsprachige Unterstützung
Erkennen Sie den Text in 140 Sprachen, einschließlich lateinischer, kyrillischer, arabischer, persischer, indic- und chinesischer Skripte, um Ihre Python -Anwendungen über Java zu gewährleisten.
Flexible Bildunterstützung
Verarbeiten Sie Bilder von Scannern, Kameras und Smartphones nahtlos mit Python über Java.
Präzision in der chinesischen Charaktererkennung
Erkennen Sie über 6.000 chinesische Charaktere mit Präzision in Ihren Python -Projekten über Java.
Schriftstile und Formatierung erhalten
Behalten Sie Schriftstile und formatieren für eine genaue Darstellung des anerkannten Textes in Ihren Python -Anwendungen über Java.
Live -Code -Beispiel
Initiieren Sie die Texterkennung aus Bildern in nur drei Codezeilen. Erleben Sie die Einfachheit!
* Durch Hochladen Ihrer Dateien oder die Verwendung des Dienstes, den Sie mit unserer zustimmen Nutzungsbedingungen Und Datenschutzrichtlinie.
Bild in Text konvertieren
Weitere Beispiele ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wählen Sie Ihre Präferenz
Wählen Sie die richtige Bibliothek für Ihre Bedürfnisse. Entdecken Sie die verfügbaren APIs und deren Funktionen, um die effizienteste Lösung auszuwählen.
Vielseitigkeit
Python via .NET
Gleichmäßigkeit
Python via Java
Leistung
Python via C++
Java -Backend -Kompatibilität
Unsere Bibliothek wurde als Python -Modul entwickelt und sorgt für die Kompatibilität für wichtige Betriebssysteme, die Java unterstützt - einschließlich Microsoft Windows, Linux und MacOS oder der Cloud -Plattform. Auf diese Weise können Sie Anwendungen auf einer Plattform entwickeln und sie nahtlos auf einer anderen ausführen, wodurch die Notwendigkeit von Codeänderungen beseitigt wird.
Unterstützte Dateiformate
Aspose.OCR for Python via Java kann mit jeder [Datei]funktionieren( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.
Bilder
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Batch OCR
- Multi-page PDF
- ZIP
- Folder
Erkennungsergebnisse
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Mühelose Installation für Python über Java
ASSON.OCR für Python über Java wird als Python-Paket oder als herunterladbare Datei mit minimalen Abhängigkeiten geliefert. Einfach Installation IT in Ihr Projekt, und Sie sind bereit, Texte in mehreren unterstützten Sprachen zu erkennen und Erkenntnisergebnisse in verschiedenen Formaten zu sparen.
Anfordern einer Testlizenz , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.
Leistungsstarke OCR für Python -Anwendungen
Unsere Bibliothek integriert sich leicht und ermöglicht es Python -Anwendungen, nahtlos auf jeder Plattform auszuführen - Desktop -Windows, Windows Server, MacOS, Linux und Cloud.
140+ Erkennungssprachen
Unsere Python- und Java -OCR -API erkennt eine Vielzahl von Sprachen und populären Schreibskripten, einschließlich gemischter Sprachen:
Überlassen Sie die Spracherkennung der Bibliothek oder definieren Sie die Sprache selbst für eine verbesserte Erkennungsleistung und -zuverlässigkeit.
- ** erweitertes Latein ** Alphabet: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und 80+ mehr;
- ** Kyrillisch ** Alphabet: Russisch, Ukrainisch, Kasach, Serbisch, Weißrussland, Bulgarisch;
- Arabisch, Persisch, Urdu;
- Chinesisch und Devanagari -Drehbuch, einschließlich Hindi, Marathi, Bhojpuri und anderen.
Verbesserte Bildverarbeitungsfilter
Die Präzision der optischen Charaktererkennung hängt stark von der Qualität des Originalbildes ab. ASSON.OCR für Python über Java bietet eine breite Palette von automatisierten und manuellen Bildverarbeitungsfiltern, um ein Bild vor der Übermittlung an die OCR -Engine zu optimieren:
- Automatisch leicht geneigte Bilder begradigen.
- Korrigieren Sie manuell die Rotation stark verzerrter Bilder.
- Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendung, unerwünschte Gradienten und andere Arten von Geräuschen.
- Passen Sie den Bildkontrast automatisch an.
- Automatisch hochskala oder die Größe des Bildes manuell ändern.
- Umwandeln Sie Bilder in Schwarzweiß oder Graustufen.
- Die Bildfarben invertieren und helle Bereiche dunkle und dunkle Bereiche erscheinen lassen.
- Erhöhen Sie die Dicke der Zeichen in einem Bild.
- Verschwommene Bilder, während sie Buchstabenkanten bewahren.
- Die Seite “Seite verzerrt” und korrekte Kameraobjektivverzerrung auf Seitenfotos.
Spezifizierte APIs für verschiedene Dokumenttypen
ASSON.OCR für Python über Java bietet speziell ausgebildete neuronale Netzwerke an, um Text aus bestimmten Bildern mit maximaler Genauigkeit zu extrahieren:
- Gescannte oder fotografierte Ausweise und Pässe.
- Fahrzeugkennzeichen.
- Rechnungen.
- Quittungen.
Eingebaute Zaubersprüche
Obwohl ASSON.OCR für Python über Java eine hohe Erkennungsgenauigkeit liefert, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Zauberprüfung einschalten, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.
Wenn der anerkannte Text spezielle Terminologie, Abkürzungen und andere Wörter enthält, die nicht in gemeinsamen Rechtschreibwörterbüchern vorhanden sind, können Sie Ihre eigenen Wortlisten bereitstellen.
Effiziente Chargenerkennung
Unsere Python OCR -API ermöglicht es Ihnen, die Bilderkennung zu optimieren. Verwenden Sie vielseitige Batch-Verarbeitungsmethoden für die effiziente Verarbeitung mehrerer Bilder in einem einzigen Aufruf:
- Erkennen Sie mehrseitige PDF-, TIFF-Dateien.
- Verarbeiten Sie alle Dateien in einem Ordner.
- Verwenden Sie die Erkennung für alle Dateien in einem Archiv.
- Erkennen Sie Bilder aus einer bestimmten Liste.
Lernen über Python -Beispiele
Erkunden Sie eine Vielzahl von Python-Beispielen , die Ihnen dabei helfen sollen, die Funktionen und Funktionen unserer OCR-Lösung schnell zu erfassen. Erhalten Sie schnell Einblicke in die Erstellung maßgeschneiderter Lösungen, die Ihren spezifischen Geschäftsanforderungen entsprechen.
Funktionen und Fähigkeiten
Aspose.OCR for Python via Java Erforschen Sie die fortgeschrittenen Merkmale von ASOSPENT.OCR für Python
Foto OCR
Text aus Smartphone-Fotos mit Genauigkeit auf Scanebene extrahieren.
Durchsuchbarer PDF
Konvertieren Sie jeden Scan in ein vollständig durchsuchbares und indexierbares Dokument.
URL -Anerkennung
Erkennen Sie ein Bild von URL, ohne es lokal herunterzuladen.
Massenerkennung
Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.
Jede Schriftart und jeder Stil
Identifizieren und erkennen Sie Text in allen beliebten Schriftarten und Stilen.
Fein-Tune-Anerkennung
Passen Sie jeden OCR -Parameter für die besten Erkennungsergebnisse an.
Zaubersprüche
Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.
Suchen Sie Text in Bildern
Suchen Sie nach Text oder regulärem Ausdruck in einem Satz von Bildern.
Vergleichen Sie Bildtexte
Vergleichen Sie Texte auf zwei Bildern, unabhängig von Fall und Layout.
Python -Code -Beispiele
Entdecken Sie Code -Beispiele, um ASPOSPEN.OCR für Python über Java nahtlos in Ihre Anwendungen zu integrieren.
Mühelose Installation
Als Python -Paket oder eine herunterladbare Datei mit minimalen Abhängigkeiten sorgt ASSOSPLE.OCR für Python über Java eine einfache Verteilung. Integrieren Sie es direkt von Python in Ihr Projekt und Sie sind bereit, die vollständigen OCR-Funktionen zu nutzen und die Erkennungsergebnisse in verschiedenen Formaten zu sparen. Eine temporäre Lizenz beseitigt alle Testversionsbeschränkungen für 30 Tage. Verwenden Sie diesen Zeitraum, um die Entwicklung eines voll funktionsfähigen OCR -Antrags zu initiieren, sodass Sie eine fundierte Entscheidung über den Kauf von ASOSPLE.OCR für Python über Java später treffen können.
Lizenz laden
lic = License()
lic.set_license(self.licPath)
Bilderkennung
Die Hauptherausforderung bei OCR -Anwendungen ist die Mangel an Scannern für Endbenutzer. Unsere API, die nahtlos in Python über Java integriert ist, verfügt über eine robuste integrierte Bild-Vorverarbeitungsfilter, die sich umgedreht, verzerrt und laute Bilder bearbeiten. In Kombination mit Unterstützung für alle Bildformate ermöglicht es eine zuverlässige Erkennung, auch von Smartphone -Fotos. Die meisten Vorverarbeitungs- und Bildkorrekturen sind automatisiert, sodass Ihre Intervention nur in anspruchsvollen Fällen erforderlich ist.
Automatische Bildkorrekturen anwenden - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Unsere API liest jedes Bild von Scannern, Kameras oder Smartphones: PDF -Dokumente, JPEG, PNG, TIFF, GIF, BMP -Dateien. Die vollständige Unterstützung für mehrseitige PDF-Dokumente, TIFF- und DJVU-Bilder gewährleistet die Vielseitigkeit. Sie können über eine URL auch ein Bild aus dem Web bereitstellen.
Erkennungsergebnisse werden in beliebten Dokumenten- und Datenaustauschformaten zurückgegeben: Klartext, PDF, Microsoft Word, Microsoft Excel, JSON und XML.
Erkennen Sie PDF und speichern Sie die Ergebnisse in verschiedenen Ausgangsformaten - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimierung der Ressourcennutzung
OCR bietet einen speziellen Erkennungsalgorithmus zum Extrahieren von Inhalten aus Bildern mit spärlichem Text und lautem/farbiger Hintergründen. Diese Methode verbessert die OCR -Genauigkeit in den folgenden Geschäftsfällen erheblich:
- Lesen Sie Text von Straßenfotos.
- Segment und identifizieren Sie Straßenschilder und Schilder in Straßenbildern.
- Suchen Sie Preisschilder und interpretieren Sie den extrahierten Text als Preise.
- Finden und aggregieren Sie Regionen von Interesse an Lebensmitteletiketten wie Ernährungsinformationen oder Zutatenlisten.
- Identifizieren und analysieren Sie die Automobilschilder.
- Text aus Menüs und Katalogen extrahieren.
Offene Fläche OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Text aus Straßenfotos extrahieren
OCR für Python bietet einen speziellen Erkennungsalgorithmus, der Text aus Fahrzeugkennzeichen, einschließlich dunkler und verschwommener Fotos, extrahiert. Der resultierende Text kann dann automatisch in der Datenbank gespeichert oder automatisch überprüft werden.
Autonummer erkennen - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)