Konvertieren Sie Bilder und PDFs in Text in .NET

Fügen Sie Ihren .NET-Anwendungen mit wenigen Codezeilen die optische Zeichenerkennung (OCR) hinzu.

Aspose.OCR für .NET ist eine leistungsstarke, aber dennoch benutzerfreundliche und kostengünstige API für die optische Zeichenerkennung. Damit können Sie Ihren .NET-Anwendungen OCR-Funktionalität in weniger als 5 Codezeilen hinzufügen, ohne sich Gedanken über komplexe Mathematik, neuronale Netze und andere technische Details machen zu müssen. Unsere Erfahrung mit maschinellen Lerntechnologien und jahrelange Entwicklung führten zu einer OCR-Engine mit überragender Geschwindigkeit und Genauigkeit, die 26 Sprachen basierend auf lateinischen und kyrillischen Schriftzeichen sowie Chinesisch unterstützt. Die OCR-API kann gescannte Bilder, Smartphone-Fotos, Screenshots, Bildbereiche und gescannte PDFs erkennen und Ergebnisse in den gängigsten Dokumenten- und Datenaustauschformaten zurückgeben. Verschiedene Vorverarbeitungsfilter ermöglichen es Ihnen, gedrehte, schiefe und verrauschte Bilder zu erkennen. Erkennungsleistung und Systemlast können weiter verbessert werden, indem ressourcenintensive Rechenaufgaben auf die GPU verlagert werden.

Auf einen Blick

Eine kurze Zusammenfassung der Möglichkeiten der optischen Zeichenerkennung.

Unterstützte Schriftarten

Arial
Times New Roman
Courier New
Tahoma
Calibri
Verdana

Unterstützte Schriftstile

Normale Schriftart
Fettgedruckte Schriftart
Kursive Schrift

Unterstützte Sprachen

Englische Sprache
chinesische Sprache
deutsche Sprache
französisch Sprache
italienische Sprache
spanische Sprache
russische Sprache
Tschechische Sprache
Polnische Sprache
ukrainische Sprache
niederländische Sprache
Estnische Sprache
und 10+ mehr

Aspose.OCR

Plattformunabhängigkeit

Aspose.OCR für .NET unterstützt .NET Standard 2.0.

.NET-Implementierungen

.NET 6.0
.NET 5.0
.NET Core
.NET Framework
Mono
Xamarin

Anwendungen

Desktop-Anwendungen
Windows-Dienste
ASP.NET MVC
ASP.NET Web API
Internetdienste
Cloud-Services

Aspose.OCR

Unterstützte Dateiformate

Konvertieren Sie jede Datei , die Sie von einem Scanner oder einer Kamera erhalten, in die gängigsten Dokument- und Datenaustauschformate.

Quelldaten

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

Erkennungsergebnisse

Durchsuchbares PDF
Microsoft Word
Microsoft Excel
Klartext
JSON
XML

Aspose.OCR

Merkmale und Fähigkeiten von Aspose.OCR für .NET

Konvertiert Bilder und PDFs in Text

Unterstützt alle Bildformate, die Sie von einem Scanner oder einer Kamera erhalten können

Liest Sprachen basierend auf Latein und Kyrillisch

Erkennt mehr als 6.000 chinesische Schriftzeichen

Erkennt und erkennt alle gängigen Schriftarten

Behält Schriftstile und Formatierung sorgfältig bei

Verarbeitet das gesamte Bild oder nur ausgewählte Bereiche

Unterstützt gedrehte, verzerrte und verrauschte Bilder

Stapelerkennung aller Bilder in einem Ordner oder Archiv

Erkennt Bilder, die als Weblinks bereitgestellt werden

Findet und korrigiert automatisch falsch geschriebene Wörter

Vollständig kompatibel mit anderen Aspose-Produkten

Einfach zu installieren

Aspose.OCR für .NET wird als leichtes NuGet-Paket oder als herunterladbare Datei mit minimalen Abhängigkeiten verteilt. Installieren Sie es einfach in Ihrem Projekt und Sie können Texte in allen unterstützten Sprachen erkennen und Erkennungsergebnisse in einem der unterstützten Formate speichern.

Fordern Sie eine temporäre Lizenz an, um mit dem Aufbau einer voll funktionsfähigen OCR-Anwendung ohne Grenzen und Einschränkungen zu beginnen.

Einfach zu verwenden

Sie benötigen drei Codezeilen, um das Bild zu erkennen und das Ergebnis anzuzeigen. Ja, es ist wirklich so einfach!

Bild zu Text in 3 Zeilen – C#

// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Bild zu Text erkennen
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Zeigen Sie das Erkennungsergebnis an
Console.WriteLine(result);

Plattformübergreifend

Die Bibliothek unterstützt .NET Standard 2.0 vollständig. Das bedeutet, dass die Anwendungen auf jeder Plattform ausgeführt werden können: Desktop Windows, Windows Server, macOS, Linux und Cloud.

26 Anerkennungssprachen

Die OCR-API kann eine große Anzahl von Sprachen und alle gängigen Schreibschriften erkennen, einschließlich Texte mit gemischten Sprachen.

Erweitertes lateinisches Alphabet : Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch.
Kyrillisches Alphabet : Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch.
Chinesisch : mehr als 6.000 Zeichen.

Sie können die Spracherkennung der Bibliothek überlassen oder die Sprache selbst definieren, um die Erkennungsleistung und -zuverlässigkeit zu erhöhen.

Fotos erkennen

Das größte Hindernis für OCR-Anwendungen besteht darin, dass Scanner für Endbenutzer nicht alltäglich sind. Die API verfügt über leistungsstarke integrierte Bildvorverarbeitungsfilter, die gedrehte, verzerrte und verrauschte Bilder verarbeiten können. In Kombination mit der Unterstützung aller Bildformate ermöglicht es eine zuverlässige Erkennung sogar von Smartphone-Fotos. Der größte Teil der Vorverarbeitung und Bildkorrektur erfolgt automatisch, sodass Sie nur in schwierigen Fällen eingreifen müssen.

Wenden Sie automatische Bildkorrekturen an – C#

// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Aktivieren Sie die automatische Schräglaufberechnung und den Kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Bild erkennen
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Universalkonverter

Die API kann buchstäblich jedes Bild lesen, das Sie von einem Scanner, einer Kamera oder einem Smartphone erhalten: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF-, BMP-Bilder und sogar DjVu-Dateien. Mehrseitige PDF-Dokumente, TIFF- und DjVu-Bilder werden vollständig unterstützt. Sie können auch ein Bild aus dem Internet über eine URL bereitstellen.

Erkennungsergebnisse werden in den gängigsten Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.

PDF erkennen und Ergebnisse in JSON speichern - C#

// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Erkennen Sie alle Seiten aus gescannten PDFs
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Geben Sie jede Seite als JSON aus
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Ressourcenoptimierung

Die optische Zeichenerkennung ist ein ressourcenintensiver Prozess. Die API bietet sehr flexible Möglichkeiten, eine Balance im klassischen Zeit-Preis-Qualitäts-Dreiklang zu finden:

Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
Entlasten Sie die CPU, indem Sie die Berechnungen auf die GPU auslagern.

Schnelle Erkennung – C#

// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Bild im schnellsten Modus erkennen
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Rechtschreibprüfung

Während die OCR zuverlässige Ergebnisse liefert, können Staub- und Druckfehler dazu führen, dass einige Symbole falsch erkannt werden. Die OCR-API verfügt über eine integrierte Rechtschreibprüfung, die falsch geschriebene Wörter automatisch ersetzt und Sie davon befreit, die Erkennungsergebnisse manuell korrigieren zu müssen.

Ergebnisse der Rechtschreibprüfung – C#

// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Aktivieren Sie den automatischen Kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Bild erkennen
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Korrigieren Sie falsch geschriebene Wörter
string text =  result.GetSpellCheckCorrectedText();

Stapelverarbeitung

Die OCR-API befreit Sie davon, jedes Bild einzeln zu erkennen, indem sie verschiedene Stapelverarbeitungsmethoden anbietet, mit denen Sie mehrere Bilder in einem Aufruf erkennen können:

Erkennung mehrseitiger PDF-, TIFF- und DjVu-Dateien.
Erkennung aller Dateien in einem Ordner.
Erkennung aller Dateien in einem Archiv.
Erkennung aller Dateien aus einer Liste.

Lernen Sie am Beispiel

Aspose.OCR für .NET wird mit einer Reihe von in C# geschriebenen Beispielen geliefert, die es Ihnen ermöglichen, sich schnell mit den Funktionen und Fähigkeiten vertraut zu machen, und Ihnen eine Vorstellung davon vermitteln, wie Sie Lösungen für Ihre Geschäftsanforderungen erstellen können.

Support and Learning Resources

Warum Aspose.OCR für .NET?
Kundenliste
Erfolgsgeschichten

Download Free Trial Pricing Information

Aspose bietet auch native OCR-APIs für andere gängige Programmiersprachen:

Konvertieren Sie Bilder und PDFs in Text in .NET

Fügen Sie Ihren .NET-Anwendungen mit wenigen Codezeilen die optische Zeichenerkennung (OCR) hinzu.

Aspose.OCR for .NET

Overview

Auf einen Blick

Plattformunabhängigkeit

Unterstützte Dateiformate

Merkmale und Fähigkeiten von Aspose.OCR für .NET

Einfach zu installieren

Einfach zu verwenden

Bild zu Text in 3 Zeilen – C#

Plattformübergreifend

26 Anerkennungssprachen

Fotos erkennen

Wenden Sie automatische Bildkorrekturen an – C#

Universalkonverter

PDF erkennen und Ergebnisse in JSON speichern - C#

Ressourcenoptimierung

Schnelle Erkennung – C#

Rechtschreibprüfung

Ergebnisse der Rechtschreibprüfung – C#

Stapelverarbeitung

Lernen Sie am Beispiel

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++