Konvertieren Sie Bilder und PDFs in Text in .NET
Fügen Sie Ihren .NET-Anwendungen mit wenigen Codezeilen die optische Zeichenerkennung (OCR) hinzu.
Download Free TrialAspose.OCR für .NET ist eine leistungsstarke, aber dennoch benutzerfreundliche und kostengünstige API für die optische Zeichenerkennung. Damit können Sie Ihren .NET-Anwendungen OCR-Funktionalität in weniger als 5 Codezeilen hinzufügen, ohne sich Gedanken über komplexe Mathematik, neuronale Netze und andere technische Details machen zu müssen. Unsere Erfahrung mit maschinellen Lerntechnologien und jahrelange Entwicklung führten zu einer OCR-Engine mit überragender Geschwindigkeit und Genauigkeit, die 26 Sprachen basierend auf lateinischen und kyrillischen Schriftzeichen sowie Chinesisch unterstützt. Die OCR-API kann gescannte Bilder, Smartphone-Fotos, Screenshots, Bildbereiche und gescannte PDFs erkennen und Ergebnisse in den gängigsten Dokumenten- und Datenaustauschformaten zurückgeben. Verschiedene Vorverarbeitungsfilter ermöglichen es Ihnen, gedrehte, schiefe und verrauschte Bilder zu erkennen. Erkennungsleistung und Systemlast können weiter verbessert werden, indem ressourcenintensive Rechenaufgaben auf die GPU verlagert werden.
Merkmale und Fähigkeiten von Aspose.OCR für .NET
Konvertiert Bilder und PDFs in Text
Unterstützt alle Bildformate, die Sie von einem Scanner oder einer Kamera erhalten können
Liest Sprachen basierend auf Latein und Kyrillisch
Erkennt mehr als 6.000 chinesische Schriftzeichen
Erkennt und erkennt alle gängigen Schriftarten
Behält Schriftstile und Formatierung sorgfältig bei
Verarbeitet das gesamte Bild oder nur ausgewählte Bereiche
Unterstützt gedrehte, verzerrte und verrauschte Bilder
Stapelerkennung aller Bilder in einem Ordner oder Archiv
Erkennt Bilder, die als Weblinks bereitgestellt werden
Findet und korrigiert automatisch falsch geschriebene Wörter
Vollständig kompatibel mit anderen Aspose-Produkten
Einfach zu installieren
Aspose.OCR für .NET wird als leichtes NuGet-Paket oder als herunterladbare Datei mit minimalen Abhängigkeiten verteilt. Installieren Sie es einfach in Ihrem Projekt und Sie können Texte in allen unterstützten Sprachen erkennen und Erkennungsergebnisse in einem der unterstützten Formate speichern.
Fordern Sie eine temporäre Lizenz an, um mit dem Aufbau einer voll funktionsfähigen OCR-Anwendung ohne Grenzen und Einschränkungen zu beginnen.
Einfach zu verwenden
Sie benötigen drei Codezeilen, um das Bild zu erkennen und das Ergebnis anzuzeigen. Ja, es ist wirklich so einfach!
Bild zu Text in 3 Zeilen – C#
// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Bild zu Text erkennen
string result = recognitionEngine.RecognizeImage("sample.jpg");
// Zeigen Sie das Erkennungsergebnis an
Console.WriteLine(result);
Plattformübergreifend
Die Bibliothek unterstützt .NET Standard 2.0 vollständig. Das bedeutet, dass die Anwendungen auf jeder Plattform ausgeführt werden können: Desktop Windows, Windows Server, macOS, Linux und Cloud.
26 Anerkennungssprachen
Die OCR-API kann eine große Anzahl von Sprachen und alle gängigen Schreibschriften erkennen, einschließlich Texte mit gemischten Sprachen.
- Erweitertes lateinisches Alphabet : Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch.
- Kyrillisches Alphabet : Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch.
- Chinesisch : mehr als 6.000 Zeichen.
Sie können die Spracherkennung der Bibliothek überlassen oder die Sprache selbst definieren, um die Erkennungsleistung und -zuverlässigkeit zu erhöhen.
Fotos erkennen
Das größte Hindernis für OCR-Anwendungen besteht darin, dass Scanner für Endbenutzer nicht alltäglich sind. Die API verfügt über leistungsstarke integrierte Bildvorverarbeitungsfilter, die gedrehte, verzerrte und verrauschte Bilder verarbeiten können. In Kombination mit der Unterstützung aller Bildformate ermöglicht es eine zuverlässige Erkennung sogar von Smartphone-Fotos. Der größte Teil der Vorverarbeitung und Bildkorrektur erfolgt automatisch, sodass Sie nur in schwierigen Fällen eingreifen müssen.
Wenden Sie automatische Bildkorrekturen an – C#
// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Aktivieren Sie die automatische Schräglaufberechnung und den Kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true,
AutoSkew = true
};
// Bild erkennen
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);
Universalkonverter
Die API kann buchstäblich jedes Bild lesen, das Sie von einem Scanner, einer Kamera oder einem Smartphone erhalten: PDF-Dokumente, JPEG-, PNG-, TIFF-, GIF-, BMP-Bilder und sogar DjVu-Dateien. Mehrseitige PDF-Dokumente, TIFF- und DjVu-Bilder werden vollständig unterstützt. Sie können auch ein Bild aus dem Internet über eine URL bereitstellen.
Erkennungsergebnisse werden in den gängigsten Dokument- und Datenaustauschformaten zurückgegeben: einfacher Text, PDF, Microsoft Word, Microsoft Excel, JSON und XML.
PDF erkennen und Ergebnisse in JSON speichern - C#
// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Erkennen Sie alle Seiten aus gescannten PDFs
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());
// Geben Sie jede Seite als JSON aus
foreach(var page in pages)
{
Console.WriteLine(page.GetJson());
}
Ressourcenoptimierung
Die optische Zeichenerkennung ist ein ressourcenintensiver Prozess. Die API bietet sehr flexible Möglichkeiten, eine Balance im klassischen Zeit-Preis-Qualitäts-Dreiklang zu finden:
- Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
- Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
- Entlasten Sie die CPU, indem Sie die Berechnungen auf die GPU auslagern.
Schnelle Erkennung – C#
// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Bild im schnellsten Modus erkennen
string result = recognitionEngine.RecognizeImageFast("sample.jpg");
Rechtschreibprüfung
Während die OCR zuverlässige Ergebnisse liefert, können Staub- und Druckfehler dazu führen, dass einige Symbole falsch erkannt werden. Die OCR-API verfügt über eine integrierte Rechtschreibprüfung, die falsch geschriebene Wörter automatisch ersetzt und Sie davon befreit, die Erkennungsergebnisse manuell korrigieren zu müssen.
Ergebnisse der Rechtschreibprüfung – C#
// OCR-Engine initialisieren
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Aktivieren Sie den automatischen Kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true
};
// Bild erkennen
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);
// Korrigieren Sie falsch geschriebene Wörter
string text = result.GetSpellCheckCorrectedText();
Stapelverarbeitung
Die OCR-API befreit Sie davon, jedes Bild einzeln zu erkennen, indem sie verschiedene Stapelverarbeitungsmethoden anbietet, mit denen Sie mehrere Bilder in einem Aufruf erkennen können:
- Erkennung mehrseitiger PDF-, TIFF- und DjVu-Dateien.
- Erkennung aller Dateien in einem Ordner.
- Erkennung aller Dateien in einem Archiv.
- Erkennung aller Dateien aus einer Liste.
Lernen Sie am Beispiel
Aspose.OCR für .NET wird mit einer Reihe von in C# geschriebenen Beispielen geliefert, die es Ihnen ermöglichen, sich schnell mit den Funktionen und Fähigkeiten vertraut zu machen, und Ihnen eine Vorstellung davon vermitteln, wie Sie Lösungen für Ihre Geschäftsanforderungen erstellen können.
Support and Learning Resources
- Warum Aspose.OCR für .NET?
- Kundenliste
- Erfolgsgeschichten