Warum ASPOST.OCR für Python über Java?

ASSON.OCR für Python über Java integriert nahtlos leistungsstarke Funktionen für optische Charaktererkennung (OCR) in Ihre plattformübergreifenden Python-Notizbücher und -Anwendungen. Mit unserer intuitiven und Hochgeschwindigkeits-API können Sie mühelos Text aus Scans, Screenshots, Weblinks oder Smartphone-Fotos extrahieren und Ergebnisse liefern, die für die Konsolidierung, Analyse oder Speicherung bereit sind. Erkennen Sie gescannte Bilder, Smartphone -Fotos, Screenshots und gescannte PDFs und speichern Sie Ergebnisse in beliebten Dokumentformaten. Fortgeschrittene Vorverarbeitungsfilter handeln gedrehte, verzerrte und laute Bilder. Optimieren Sie die Leistung, indem Sie Aufgaben in die GPU abladen.

Illustration ocr

Schnelle und genaue OCR

Erreichen Sie mit unserem fortschrittlichen Python über Java-Technologie Hochgeschwindigkeits- und genaue OCR-Ergebnisse.

Mehrsprachige Unterstützung

Erkennen Sie den Text in 140 Sprachen, einschließlich lateinischer, kyrillischer, arabischer, persischer, indic- und chinesischer Skripte, um Ihre Python -Anwendungen über Java zu gewährleisten.

Flexible Bildunterstützung

Verarbeiten Sie Bilder von Scannern, Kameras und Smartphones nahtlos mit Python über Java.

Präzision in der chinesischen Charaktererkennung

Erkennen Sie über 6.000 chinesische Charaktere mit Präzision in Ihren Python -Projekten über Java.

Schriftstile und Formatierung erhalten

Behalten Sie Schriftstile und formatieren für eine genaue Darstellung des anerkannten Textes in Ihren Python -Anwendungen über Java.

Live -Code -Beispiel

Initiieren Sie die Texterkennung aus Bildern in nur drei Codezeilen. Erleben Sie die Einfachheit!

Bereit zu erkennen Bereit zu erkennen Lassen Sie hier eine Datei fallen oder klicken Sie, um zu durchsuchen *

* Durch Hochladen Ihrer Dateien oder die Verwendung des Dienstes, den Sie mit unserer zustimmen Nutzungsbedingungen Und Datenschutzrichtlinie.

Erkennungsergebnis
 

Bild in Text konvertieren

Weitere Beispiele >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Wählen Sie Ihre Präferenz

Wählen Sie die richtige Bibliothek für Ihre Bedürfnisse. Entdecken Sie die verfügbaren APIs und deren Funktionen, um die effizienteste Lösung auszuwählen.

Vielseitigkeit

Python via .NET

Einfache Entwicklung, Lesbarkeit und Wartbarkeit des Codes
Bietet die meisten Funktionen und erhält die häufigsten Updates
Die Gesamtgeschwindigkeit kann etwas langsamer sein als andere Plattformen

Gleichmäßigkeit

Python via Java

Verwenden Sie dieselbe Bibliothek auf jeder Plattform
Führen Sie Ihre Anwendung nahtlos auf jedem Gerät aus
Erfordert die Java Runtime Environment (JRE) Version 8 oder später

Leistung

Python via C++

Die schnellstmögliche Geschwindigkeit unabhängig von der Plattform
Viel Kontrolle über das Ressourcenmanagement
Auf erfahrene Entwickler ausgerichtet

Java -Backend -Kompatibilität

Unsere Bibliothek wurde als Python -Modul entwickelt und sorgt für die Kompatibilität für wichtige Betriebssysteme, die Java unterstützt - einschließlich Microsoft Windows, Linux und MacOS oder der Cloud -Plattform. Auf diese Weise können Sie Anwendungen auf einer Plattform entwickeln und sie nahtlos auf einer anderen ausführen, wodurch die Notwendigkeit von Codeänderungen beseitigt wird.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Unterstützte Dateiformate

Aspose.OCR for Python via Java kann mit jeder [Datei]funktionieren( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.

Bilder

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Batch OCR

  • Multi-page PDF
  • ZIP
  • Folder

Erkennungsergebnisse

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Mühelose Installation für Python über Java

ASSON.OCR für Python über Java wird als Python-Paket oder als herunterladbare Datei mit minimalen Abhängigkeiten geliefert. Einfach Installation IT in Ihr Projekt, und Sie sind bereit, Texte in mehreren unterstützten Sprachen zu erkennen und Erkenntnisergebnisse in verschiedenen Formaten zu sparen.

Anfordern einer Testlizenz , um die Entwicklung einer voll funktionsfähigen OCR-Anwendung ohne Einschränkungen zu starten.

Leistungsstarke OCR für Python -Anwendungen

Unsere Bibliothek integriert sich leicht und ermöglicht es Python -Anwendungen, nahtlos auf jeder Plattform auszuführen - Desktop -Windows, Windows Server, MacOS, Linux und Cloud.

140+ Erkennungssprachen

Unsere Python- und Java -OCR -API erkennt eine Vielzahl von Sprachen und populären Schreibskripten, einschließlich gemischter Sprachen:

Überlassen Sie die Spracherkennung der Bibliothek oder definieren Sie die Sprache selbst für eine verbesserte Erkennungsleistung und -zuverlässigkeit.

  • ** erweitertes Latein ** Alphabet: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und 80+ mehr;
  • ** Kyrillisch ** Alphabet: Russisch, Ukrainisch, Kasach, Serbisch, Weißrussland, Bulgarisch;
  • Arabisch, Persisch, Urdu;
  • Chinesisch und Devanagari -Drehbuch, einschließlich Hindi, Marathi, Bhojpuri und anderen.

Verbesserte Bildverarbeitungsfilter

Die Präzision der optischen Charaktererkennung hängt stark von der Qualität des Originalbildes ab. ASSON.OCR für Python über Java bietet eine breite Palette von automatisierten und manuellen Bildverarbeitungsfiltern, um ein Bild vor der Übermittlung an die OCR -Engine zu optimieren:

  • Automatisch leicht geneigte Bilder begradigen.
  • Korrigieren Sie manuell die Rotation stark verzerrter Bilder.
  • Entfernen Sie automatisch Schmutz, Flecken, Kratzer, Blendung, unerwünschte Gradienten und andere Arten von Geräuschen.
  • Passen Sie den Bildkontrast automatisch an.
  • Automatisch hochskala oder die Größe des Bildes manuell ändern.
  • Umwandeln Sie Bilder in Schwarzweiß oder Graustufen.
  • Die Bildfarben invertieren und helle Bereiche dunkle und dunkle Bereiche erscheinen lassen.
  • Erhöhen Sie die Dicke der Zeichen in einem Bild.
  • Verschwommene Bilder, während sie Buchstabenkanten bewahren.
  • Die Seite “Seite verzerrt” und korrekte Kameraobjektivverzerrung auf Seitenfotos.

Spezifizierte APIs für verschiedene Dokumenttypen

ASSON.OCR für Python über Java bietet speziell ausgebildete neuronale Netzwerke an, um Text aus bestimmten Bildern mit maximaler Genauigkeit zu extrahieren:

  • Gescannte oder fotografierte Ausweise und Pässe.
  • Fahrzeugkennzeichen.
  • Rechnungen.
  • Quittungen.

Eingebaute Zaubersprüche

Obwohl ASSON.OCR für Python über Java eine hohe Erkennungsgenauigkeit liefert, können Druckfehler, Schmutz oder nicht standardmäßige Schriftarten dazu führen, dass bestimmte Zeichen oder Wörter falsch erkannt werden. Um die Erkennungsergebnisse weiter zu verbessern, können Sie die Zauberprüfung einschalten, die Rechtschreibfehler basierend auf der ausgewählten Erkennungssprache findet und automatisch korrigiert.

Wenn der anerkannte Text spezielle Terminologie, Abkürzungen und andere Wörter enthält, die nicht in gemeinsamen Rechtschreibwörterbüchern vorhanden sind, können Sie Ihre eigenen Wortlisten bereitstellen.

Effiziente Chargenerkennung

Unsere Python OCR -API ermöglicht es Ihnen, die Bilderkennung zu optimieren. Verwenden Sie vielseitige Batch-Verarbeitungsmethoden für die effiziente Verarbeitung mehrerer Bilder in einem einzigen Aufruf:

  • Erkennen Sie mehrseitige PDF-, TIFF-Dateien.
  • Verarbeiten Sie alle Dateien in einem Ordner.
  • Verwenden Sie die Erkennung für alle Dateien in einem Archiv.
  • Erkennen Sie Bilder aus einer bestimmten Liste.

Lernen über Python -Beispiele

Erkunden Sie eine Vielzahl von Python-Beispielen , die Ihnen dabei helfen sollen, die Funktionen und Funktionen unserer OCR-Lösung schnell zu erfassen. Erhalten Sie schnell Einblicke in die Erstellung maßgeschneiderter Lösungen, die Ihren spezifischen Geschäftsanforderungen entsprechen.

Funktionen und Fähigkeiten

Aspose.OCR for Python via Java Erforschen Sie die fortgeschrittenen Merkmale von ASOSPENT.OCR für Python

Feature icon

Foto OCR

Text aus Smartphone-Fotos mit Genauigkeit auf Scanebene extrahieren.

Feature icon

Durchsuchbarer PDF

Konvertieren Sie jeden Scan in ein vollständig durchsuchbares und indexierbares Dokument.

Feature icon

URL -Anerkennung

Erkennen Sie ein Bild von URL, ohne es lokal herunterzuladen.

Feature icon

Massenerkennung

Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.

Feature icon

Jede Schriftart und jeder Stil

Identifizieren und erkennen Sie Text in allen beliebten Schriftarten und Stilen.

Feature icon

Fein-Tune-Anerkennung

Passen Sie jeden OCR -Parameter für die besten Erkennungsergebnisse an.

Feature icon

Zaubersprüche

Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.

Feature icon

Suchen Sie Text in Bildern

Suchen Sie nach Text oder regulärem Ausdruck in einem Satz von Bildern.

Feature icon

Vergleichen Sie Bildtexte

Vergleichen Sie Texte auf zwei Bildern, unabhängig von Fall und Layout.

Python -Code -Beispiele

Entdecken Sie Code -Beispiele, um ASPOSPEN.OCR für Python über Java nahtlos in Ihre Anwendungen zu integrieren.

Mühelose Installation

Als Python -Paket oder eine herunterladbare Datei mit minimalen Abhängigkeiten sorgt ASSOSPLE.OCR für Python über Java eine einfache Verteilung. Integrieren Sie es direkt von Python in Ihr Projekt und Sie sind bereit, die vollständigen OCR-Funktionen zu nutzen und die Erkennungsergebnisse in verschiedenen Formaten zu sparen. Eine temporäre Lizenz beseitigt alle Testversionsbeschränkungen für 30 Tage. Verwenden Sie diesen Zeitraum, um die Entwicklung eines voll funktionsfähigen OCR -Antrags zu initiieren, sodass Sie eine fundierte Entscheidung über den Kauf von ASOSPLE.OCR für Python über Java später treffen können.

Lizenz laden

lic = License()
lic.set_license(self.licPath)

Bilderkennung

Die Hauptherausforderung bei OCR -Anwendungen ist die Mangel an Scannern für Endbenutzer. Unsere API, die nahtlos in Python über Java integriert ist, verfügt über eine robuste integrierte Bild-Vorverarbeitungsfilter, die sich umgedreht, verzerrt und laute Bilder bearbeiten. In Kombination mit Unterstützung für alle Bildformate ermöglicht es eine zuverlässige Erkennung, auch von Smartphone -Fotos. Die meisten Vorverarbeitungs- und Bildkorrekturen sind automatisiert, sodass Ihre Intervention nur in anspruchsvollen Fällen erforderlich ist.

Automatische Bildkorrekturen anwenden - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Unsere API liest jedes Bild von Scannern, Kameras oder Smartphones: PDF -Dokumente, JPEG, PNG, TIFF, GIF, BMP -Dateien. Die vollständige Unterstützung für mehrseitige PDF-Dokumente, TIFF- und DJVU-Bilder gewährleistet die Vielseitigkeit. Sie können über eine URL auch ein Bild aus dem Web bereitstellen.

Erkennungsergebnisse werden in beliebten Dokumenten- und Datenaustauschformaten zurückgegeben: Klartext, PDF, Microsoft Word, Microsoft Excel, JSON und XML.

Erkennen Sie PDF und speichern Sie die Ergebnisse in verschiedenen Ausgangsformaten - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimierung der Ressourcennutzung

OCR bietet einen speziellen Erkennungsalgorithmus zum Extrahieren von Inhalten aus Bildern mit spärlichem Text und lautem/farbiger Hintergründen. Diese Methode verbessert die OCR -Genauigkeit in den folgenden Geschäftsfällen erheblich:

  • Lesen Sie Text von Straßenfotos.
  • Segment und identifizieren Sie Straßenschilder und Schilder in Straßenbildern.
  • Suchen Sie Preisschilder und interpretieren Sie den extrahierten Text als Preise.
  • Finden und aggregieren Sie Regionen von Interesse an Lebensmitteletiketten wie Ernährungsinformationen oder Zutatenlisten.
  • Identifizieren und analysieren Sie die Automobilschilder.
  • Text aus Menüs und Katalogen extrahieren.

Offene Fläche OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Text aus Straßenfotos extrahieren

OCR für Python bietet einen speziellen Erkennungsalgorithmus, der Text aus Fahrzeugkennzeichen, einschließlich dunkler und verschwommener Fotos, extrahiert. Der resultierende Text kann dann automatisch in der Datenbank gespeichert oder automatisch überprüft werden.

Autonummer erkennen - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)