Warum sollten Sie sich für die Aspose OCR-Bibliothek entscheiden?

Integrieren Sie in Sekundenschnelle leistungsstarke OCR-Funktionen in Ihre .NET-Apps. Mit unserer benutzerfreundlichen OCR-API können Sie mit minimalem C#-Code Text aus Bildern und Scans extrahieren, durchsuchbare PDFs erstellen und vieles mehr. Ideal für .NET-Desktop-, Web-, Cloud- und serverlose Funktionen. Klicken Sie auf die folgenden Elemente, um mehr über unsere Funktionen und Vorteile zu erfahren.

Illustration ocr

Globale OCR-Anwendungen

C# OCR erkennt englische, kyrillische, arabische, persische, chinesische, japanische, koreanische, hindi-, tamilische und gemischtsprachige Texte.

Lesen Sie alles

Erhalten Sie Text aus jeder Datei, die Sie über einen Scanner oder eine Kamera erhalten haben, und verarbeiten Sie Bilder direkt über Weblinks.

Zuverlässige Ergebnisse

Erzielen Sie eine hohe Erkennungsgenauigkeit für alle Bilder, auch für unscharfe, gedrehte, verzerrte und verrauschte Bilder.

Chargenerkennung

Massenerkennung aller Bilder aus Ordnern und Archiven; Lesen Sie mehrseitige PDF-Dokumente und TIFF-Bilder.

Layouterkennung

Identifizieren und kategorisieren Sie Inhaltsblöcke in Bildern, um unabhängig vom Layout die richtige Reihenfolge des extrahierten Texts sicherzustellen.

Live-Codebeispiel

.NET OCR wird mit der Aspose OCR API selbst für neue Entwickler zu einer trivialen und unkomplizierten Aufgabe. Nur wenige Codezeilen reichen aus, um Text aus einem Bild zu extrahieren und auf dem Bildschirm anzuzeigen. Es ist wirklich so einfach – probieren Sie es aus.

Bereit zu erkennen Bereit zu erkennen Legen Sie hier eine Datei ab oder klicken Sie zum Durchsuchen *

* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.

Erkennungsergebnis
 

Bild in Text umwandeln

Weitere Beispiele >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Plattformunabhängigkeit

Die plattformübergreifende OCR-Bibliothek kann überall unter .NET, .NET Core oder .NET Framework funktionieren – ob auf einem lokalen Computer, auf dem Webserver oder in der Cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Unterstützte Dateiformate

Aspose.OCR for .NET kann mit jeder [Datei]arbeiten( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.

Bilder

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch-OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Anerkennungsergebnisse

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Für jeden Inhalt geeignet

Die Genauigkeit und Zuverlässigkeit der Texterkennung in C# hängen weitgehend von der Bildqualität ab. .NET OCR bietet einen vollständigen Satz automatisierter und manueller Bildoptimierung und gewährleistet so hervorragende Erkennungsergebnisse.

Leistungsstarke Bildverarbeitung, vollständig anpassbare Texterkennung, Nachbearbeitung und automatische Rechtschreibkorrektur ermöglichen die Textextraktion aus jedem Scan oder Foto mit höchster Genauigkeit.

OCR-Ressourcenoptimierung

Die C#-OCR-Bibliothek von Aspose ermöglicht eine äußerst flexible Abstimmung von Erkennungsgeschwindigkeit, Qualität und Ressourcennutzung für jeden spezifischen Anwendungsfall:

  • Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
  • Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie unsere .NET OCR-Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
  • Entlasten Sie die CPU, indem Sie die Berechnungen auf die GPU verlagern.

Über 140 Erkennungssprachen

Unsere C#-OCR-Bibliothek ist eine universelle Lösung für die Dokumentenverarbeitung, Datenextraktion und Inhaltsdigitalisierung auf globaler Ebene. Da es eine Vielzahl europäischer, nahöstlicher und asiatischer Schreibskripte unterstützt, eignet es sich für jedes Land und jedes Unternehmen.

Sie können Dokumente erkennen, die in gemischten Sprachen verfasst sind, beispielsweise Chinesisch/Englisch, Arabisch/Französisch oder Kyrillisch/Englisch. Folgende Sprachen werden unterstützt:

  • Erweitertes Latein: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und über 80 weitere;
  • Kyrillisches Alphabet: Russisch, Ukrainisch, Kasachisch, Bulgarisch, einschließlich gemischter kyrillischer/englischer Texte;
  • Arabisch, Persisch, Urdu, einschließlich mit Englisch gemischter Texte;
  • Chinesisch, Koreanisch, Japanisch, Devanagari und dravidische Sprachen, einschließlich Hindi, Tamil, Marathi und andere.

Funktionen und Fähigkeiten

C# OCR extrahiert automatisch Text aus Fotos oder Scans und macht das manuelle erneute Eintippen von Dokumenten überflüssig.

Feature icon

Foto-OCR

Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.

Feature icon

Durchsuchbares PDF

Wandeln Sie jeden Scan in ein vollständig durchsuchbares und indizierbares Dokument um.

Feature icon

URL-Erkennung

Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.

Feature icon

Massenerkennung

Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.

Feature icon

Beliebige Schriftart und Stil

Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.

Feature icon

Feinabstimmung der Erkennung

Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.

Feature icon

Rechtschreibprüfung

Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.

Feature icon

Finden Sie Text in Bildern

Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.

Feature icon

Vergleichen Sie Bildtexte

Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.

Einfach zu verwendende OCR

Mit unserer C#-OCR-API benötigen Sie nur ein paar Zeilen C#-Code, um Bilder in Text umzuwandeln, eine durchsuchbare PDF-Datei zu erstellen, Erkennungsergebnisse in einem Dokument zu speichern und vieles mehr. Entdecken Sie die Codebeispiele, um zu verstehen, wie Sie unsere OCR-API in Ihre .NET-Lösungen integrieren.

Installation

.NET OCR wird als NuGet-Paket oder als herunterladbare Datei verteilt /) mit minimalen Abhängigkeiten. Das Paket kann direkt aus Microsoft Visual Studio zu Ihrem Projekt hinzugefügt werden. Installieren Sie es einfach in Ihrem Projekt und schon können Sie Text aus Bildern extrahieren und Erkennungsergebnisse in einem der unterstützten Formate speichern. Wenn Ihr System über eine CUDA-fähige GPU verfügt, können Sie die GPU-beschleunigte OCR-Engine verwenden, um die Erkennungsleistung deutlich zu steigern.

Mit einigen [Einschränkungen]können Sie Aspose OCR für .NET direkt nach der Installation verwenden ( https://docs.aspose.com/ocr/net/licensing/) . Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie es, um mit dem Aufbau einer voll funktionsfähigen OCR-Anwendung zu beginnen und später die endgültige Entscheidung zum Kauf von OCR für .NET zu treffen.

Extrahieren Sie Text aus einem Foto

Wenn man normalerweise an OCR (Optical Character Recognition) denkt, denkt man zunächst oft an einen Scanner als primäres Erfassungsgerät. Diese Assoziation hat historische Gründe und ist in vielen Zusammenhängen noch immer weit verbreitet. Sie bietet eine konsistente und kontrollierte Umgebung für die Erfassung gedruckter Texte aus physischen Dokumenten in unübertroffener Qualität. Allerdings handelt es sich bei einem Scanner um ein Spezialgerät, das nicht immer zur Hand ist und für dessen Betrieb ein stationärer Arbeitsplatz erforderlich ist. Glücklicherweise bietet die moderne Welt eine praktische Alternative zu herkömmlichen Scannern – eine Smartphone-Kamera. Die Fortschritte in der Smartphone-Kameratechnologie stellen sicher, dass selbst ein Einsteiger-Smartphone eine ausreichende Qualität bietet, um OCR-fähige Dokumente zu erfassen. Und der integrierte Speicher macht es einfacher als je zuvor, große Mengen an Dokumenten, Zeitungen, Büchern, Straßenschildern und anderen Texten unterwegs zu digitalisieren. Sie benötigen lediglich die richtige Technologie, um diese Fotos in maschinenlesbaren Text umzuwandeln.

Unsere C#-OCR-Bibliothek ist speziell dafür konzipiert, alle Arten von Bildern sofort zu erkennen und kann weiter verfeinert werden, um auch Fotos mit geringer Qualität zu verarbeiten. In Kombination mit einem modernen Smartphone können Sie leistungsstarke OCR-Anwendungen für die meisten alltäglichen Scan- und Texterkennungsaufgaben erstellen. Die fortschrittlichste Bildverarbeitung und Dokumentstrukturanalyse werden in wenigen Codezeilen durchgeführt, sodass Sie sich auf das Geschäft konzentrieren können und nicht auf komplexe mathematische Algorithmen, neuronale Netze und andere technische Feinheiten.

Foto-OCR – C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Erstellen Sie aus dem Scan ein durchsuchbares PDF

PDF ist eines der beliebtesten Formate zum Scannen von Papierdokumenten, insbesondere aufgrund der Möglichkeit, mehrere Seiten in einer einzigen Datei zusammenzufassen. Dieses Format wird häufig für den Austausch von Verträgen, Rechnungen, Rechtsdokumenten, Pässen und Personalausweisen sowie vielen anderen Dokumenten zwischen Einzelpersonen, Unternehmen, Banken und Regierungsbehörden verwendet. Allerdings ist jedes gescannte PDF im Wesentlichen eine Sammlung von Bildern. Es enthält keinen maschinenlesbaren Text, sodass Benutzer den Inhalt des Dokuments nicht durchsuchen, kopieren oder anderweitig manipulieren können.

Aspose .NET OCR bietet Ihnen eine schnelle, einfache und äußerst zuverlässige Möglichkeit, jedes gescannte PDF in ein vollständig durchsuchbares und indizierbares Dokument umzuwandeln. Es erkennt Seiteninhalte genau und wandelt sie in eine maschinenlesbare Textebene über dem Originalbild um, die ausgewählt, kopiert, von Text-to-Speech-Software gelesen und sogar automatisch von Übersetzern, Zusammenfassungen und anderen KI-gestützten Analysen verarbeitet werden kann Werkzeuge.

Textüberlagerung zu PDF hinzufügen – C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Suchen Sie nach Text in Bildern

Digitale Archive, insbesondere in großen Organisationen, bestehen oft aus einer riesigen Sammlung von Scans und Fotos, von denen viele mehrseitige Dokumente enthalten können. Eine effiziente Verwaltung und Organisation solcher Archive ist für den einfachen Informationsabruf und die einfache Navigation von entscheidender Bedeutung. Allerdings enthalten Bilder keinen maschinenlesbaren Text, sodass eine Suche und Analyse des Dokumentinhalts nicht möglich ist.

Mit der C#-OCR-Bibliothek können Sie problemlos nach Text in Bildern suchen, unabhängig von Schriftart, Textgröße, Stil und anderen Parametern. Die Bibliothek unterstützt auch Suchvorgänge ohne Berücksichtigung der Groß-/Kleinschreibung und reguläre Ausdrücke, die in verschiedenen Anwendungen und Branchen äußerst nützlich sind. Diese Funktionalität kann zum Kategorisieren von Dokumenten basierend auf dem Inhalt, Schlüsselwörtern oder im Text gefundenen Mustern verwendet werden; Suche nach bestimmten Bedingungen oder Klauseln in Vereinbarungen und Verträgen; Reorganisieren von Dateien basierend auf Schlüsselwörtern oder darin enthaltenen Inhalten; Lokalisieren und identifizieren Sie personenbezogene Daten in Dokumenten und erleichtern Sie so die Einhaltung der DSGVO und die effektivere Verwaltung sensibler Informationen. Die Suche innerhalb von Bildern ermöglicht auch die Erstellung automatisierter Arbeitsabläufe und die Optimierung verschiedener Geschäftsprozesse nach Erhalt unterzeichneter Verträge und Rechnungen.

Nach Text in Bildern suchen – C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}