Warum Aspose.OCR für .NET?

Aspose.OCR für .NET ist eine robuste, entwicklerfreundliche und kostengünstige API für die optische Zeichenerkennung. Mit weniger als 10 Zeilen nativem C#-Code können Sie OCR-Funktionen in Ihre .NET-Desktoplösungen, MVC-basierten Webanwendungen, Cloud-Dienste und serverlosen Azure-Funktionen integrieren. Extrahieren Sie maschinenlesbaren Text aus Scans, Fotos und Screenshots, wandeln Sie gescannte Seiten in durchsuchbare und indizierbare PDFs um, suchen und vergleichen Sie Text auf Bildern, wobei der Schwerpunkt auf geschäftlichen Aufgaben liegt und nicht auf komplexer Mathematik, neuronalen Netzen und anderen technischen Feinheiten. Klicken Sie auf die folgenden Elemente, um mehr über unsere Funktionen und Vorteile zu erfahren.

Illustration ocr

Globale Anwendungen

Erkennen Sie Texte in lateinischer, kyrillischer und asiatischer Schrift, darunter mehr als 6.000 chinesische Schriftzeichen und Hindi.

Lesen Sie alles

Rufen Sie Text aus jeder Datei ab, die Sie über einen Scanner oder eine Kamera erhalten haben, und verarbeiten Sie Bilder direkt über Weblinks.

Zuverlässige Ergebnisse

Erzielen Sie eine hohe Erkennungsgenauigkeit für alle Bilder, auch für unscharfe, gedrehte, verzerrte und verrauschte Bilder.

Chargenerkennung

Massenerkennung aller Bilder aus Ordnern und Archiven; Lesen Sie mehrseitige PDF-Dokumente und TIFF-Bilder.

Layouterkennung

Identifizieren und kategorisieren Sie Inhaltsblöcke in Bildern, um unabhängig vom Layout die richtige Reihenfolge des extrahierten Texts sicherzustellen.

Live-Codebeispiel

Die optische Zeichenerkennung wird mit Aspose.OCR zu einer trivialen und unkomplizierten Aufgabe, selbst für Entwickler, die mit der Technologie noch nicht vertraut sind. Nur wenige Codezeilen reichen aus, um Text aus einem Bild zu extrahieren und auf dem Bildschirm anzuzeigen. Es ist wirklich so einfach – probieren Sie es aus.

Bereit zu erkennen Bereit zu erkennen Legen Sie hier eine Datei ab oder klicken Sie zum Durchsuchen *

* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.

Erkennungsergebnis
 

Bild in Text umwandeln

Mehr Beispiele >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Plattformunabhängigkeit

Aspose.OCR für .NET kann auf jeder Plattform arbeiten, die .NET, .NET Core oder .NET Framework unterstützt – egal ob auf einer lokalen Plattform Maschine, auf dem Webserver oder in der Cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Unterstützte Dateiformate

Aspose.OCR for .NET kann mit praktisch jeder [Datei]arbeiten( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse werden in den gängigsten Datei- und Datenaustauschformaten zurückgegeben, die gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden können.

Bilder

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch-OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Anerkennungsergebnisse

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Für jeden Inhalt geeignet

Die Genauigkeit und Zuverlässigkeit der Texterkennung hängt stark von der Qualität des Originalbildes ab. Aspose.OCR für .NET bietet eine umfangreiche Auswahl an vollautomatischen und manuellen Bildverarbeitungsfiltern, die ein Bild verbessern, bevor es an die OCR-Engine gesendet wird.

Leistungsstarke Bildverarbeitung und anpassbare Algorithmen zur Erkennung der Inhaltsstruktur ermöglichen die Textextraktion aus praktisch jedem Bild, von hochwertigen Scans bis hin zu Straßenfotos. Um die beste Erkennungsqualität zu erzielen, können mehrere Verarbeitungsfilter auf dasselbe Bild angewendet werden.

Ressourcenoptimierung

Aspose.OCR für .NET ermöglicht eine hochflexible Abstimmung von Erkennungsgeschwindigkeit, Qualität und Ressourcennutzung für jeden spezifischen Anwendungsfall:

  • Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
  • Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
  • Entlasten Sie die CPU, indem Sie die Berechnungen auf die GPU verlagern.

28 Erkennungssprachen

Aspose.OCR für .NET ist eine universelle Lösung für die Dokumentenverarbeitung, Datenextraktion und Inhaltsdigitalisierung auf globaler Ebene. Da es eine Vielzahl europäischer und asiatischer Schreibskripte unterstützt, eignet es sich für jede Größenordnung und richtet sich sowohl an kleine und mittlere Unternehmen als auch an multinationale Konzerne.

Sie können die Spracherkennung an die Bibliothek delegieren oder die Sprache manuell angeben und so die Erkennungsleistung und -zuverlässigkeit verbessern. Folgende Sprachen werden unterstützt:

  • Erweitertes lateinisches Alphabet: Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch;
  • Kyrillisches Alphabet: Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch;
  • Über 6.000 chinesische Zeichen;
  • Hindi.

Funktionen und Fähigkeiten

Aspose.OCR für .NET extrahiert automatisch Text aus Fotos oder gescannten Bildern, sodass keine manuelle Eingabe von Dokumenten erforderlich ist.

Feature icon

Foto-OCR

Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.

Feature icon

Durchsuchbares PDF

Wandeln Sie jeden Scan in ein vollständig durchsuchbares und indizierbares Dokument um.

Feature icon

URL-Erkennung

Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.

Feature icon

Massenerkennung

Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.

Feature icon

Beliebige Schriftart und Stil

Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.

Feature icon

Feinabstimmung der Erkennung

Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.

Feature icon

Rechtschreibprüfung

Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.

Feature icon

Finden Sie Text in Bildern

Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.

Feature icon

Vergleichen Sie Bildtexte

Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß-/Kleinschreibung und Layout.

Einfach zu verwenden

Sie benötigen nur ein paar Codezeilen, um Bilder in Text umzuwandeln, eine durchsuchbare PDF-Datei zu erstellen, Erkennungsergebnisse in einem Dokument zu speichern und vieles mehr. Erkunden Sie die Codebeispiele, um zu verstehen, wie Sie Aspose.OCR für .NET in Ihre Lösungen integrieren.

Installation

Aspose.OCR für .NET wird als NuGet-Paket oder als herunterladbare Datei verteilt. ocr/net/) mit minimalen Abhängigkeiten. Das Paket kann direkt aus Microsoft Visual Studio zu Ihrem Projekt hinzugefügt werden. Installieren Sie es einfach in Ihrem Projekt und schon können Sie Text aus Bildern extrahieren und Erkennungsergebnisse in einem der unterstützten Formate speichern. Wenn Ihr System über eine CUDA-fähige GPU verfügt, können Sie die GPU-beschleunigte OCR-Engine verwenden, um die Erkennungsleistung deutlich zu steigern.

Mit einigen [Einschränkungen]können Sie Aspose.OCR für .NET direkt nach der Installation verwenden ( https://docs.aspose.com/ocr/net/licensing/) . Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie es, um mit dem Aufbau einer voll funktionsfähigen OCR-Anwendung zu beginnen und später die endgültige Entscheidung zum Kauf von Aspose.OCR für .NET zu treffen.

Extrahieren Sie Text aus einem Foto

Wenn man normalerweise an OCR (Optical Character Recognition) denkt, denkt man zunächst oft an einen Scanner als primäres Erfassungsgerät. Diese Assoziation hat historische Gründe und ist in vielen Kontexten noch immer weit verbreitet. Sie bietet eine konsistente und kontrollierte Umgebung für die Erfassung gedruckter Texte aus physischen Dokumenten in unübertroffener Qualität. Allerdings handelt es sich bei einem Scanner um ein Spezialgerät, das nicht immer zur Hand ist und für dessen Betrieb ein stationärer Arbeitsplatz erforderlich ist. Glücklicherweise bietet die moderne Welt eine praktische Alternative zu herkömmlichen Scannern – eine Smartphone-Kamera. Die Fortschritte in der Smartphone-Kameratechnologie stellen sicher, dass selbst ein Einsteiger-Smartphone eine ausreichende Qualität bietet, um OCR-fähige Dokumente zu erfassen. Und der integrierte Speicher macht es einfacher als je zuvor, große Mengen an Dokumenten, Zeitungen, Büchern, Straßenschildern und anderen Texten unterwegs zu digitalisieren. Sie benötigen lediglich die richtige Technologie, um diese Fotos in maschinenlesbaren Text umzuwandeln.

Aspose.OCR für .NET wurde speziell für die sofortige Erkennung aller Arten von Bildern entwickelt und kann weiter verfeinert werden, um auch Fotos mit geringer Qualität zu verarbeiten. In Kombination mit einem modernen Smartphone können Sie leistungsstarke OCR-Anwendungen für die meisten alltäglichen Scan- und Texterkennungsaufgaben erstellen. Die fortschrittlichste Bildverarbeitung und Dokumentstrukturanalyse werden in wenigen Codezeilen durchgeführt, sodass Sie sich auf das Geschäft konzentrieren können und nicht auf komplexe mathematische Algorithmen, neuronale Netze und andere technische Feinheiten.

Foto-OCR – C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Erstellen Sie aus dem Scan ein durchsuchbares PDF

PDF ist eines der beliebtesten Formate zum Scannen von Papierdokumenten, insbesondere aufgrund der Möglichkeit, mehrere Seiten in einer einzigen Datei zusammenzufassen. Dieses Format wird häufig für den Austausch von Verträgen, Rechnungen, Rechtsdokumenten, Pässen und Personalausweisen sowie vielen anderen Dokumenten zwischen Einzelpersonen, Unternehmen, Banken und Regierungsbehörden verwendet. Allerdings ist jedes gescannte PDF im Wesentlichen eine Sammlung von Bildern. Es enthält keinen maschinenlesbaren Text, sodass Benutzer den Inhalt des Dokuments nicht durchsuchen, kopieren oder anderweitig manipulieren können.

Aspose.OCR für .NET bietet Ihnen eine schnelle, einfache und äußerst zuverlässige Möglichkeit, jedes gescannte PDF in ein vollständig durchsuchbares und indizierbares Dokument umzuwandeln. Es erkennt Seiteninhalte genau und wandelt sie in eine maschinenlesbare Textebene über dem Originalbild um, die ausgewählt, kopiert, von Text-to-Speech-Software gelesen und sogar automatisch von Übersetzern, Zusammenfassungen und anderen KI-gestützten Analysen verarbeitet werden kann Werkzeuge.

Textüberlagerung zu PDF hinzufügen – C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Suchen Sie nach Text in Bildern

Digitale Archive, insbesondere in großen Organisationen, bestehen oft aus einer riesigen Sammlung von Scans und Fotos, von denen viele mehrseitige Dokumente enthalten können. Eine effiziente Verwaltung und Organisation solcher Archive ist für den einfachen Informationsabruf und die einfache Navigation von entscheidender Bedeutung. Allerdings enthalten Bilder keinen maschinenlesbaren Text, sodass eine Suche und Analyse des Dokumentinhalts nicht möglich ist.

Aspose.OCR für .NET ermöglicht Ihnen die einfache Suche nach Text in Bildern, unabhängig von Schriftart, Textgröße, Stil und anderen Parametern. Die Bibliothek unterstützt auch Suchvorgänge ohne Berücksichtigung der Groß-/Kleinschreibung und reguläre Ausdrücke, die in verschiedenen Anwendungen und Branchen äußerst nützlich sind. Diese Funktionalität kann zum Kategorisieren von Dokumenten basierend auf dem Inhalt, Schlüsselwörtern oder im Text gefundenen Mustern verwendet werden; Suche nach bestimmten Bedingungen oder Klauseln in Vereinbarungen und Verträgen; Reorganisieren von Dateien basierend auf Schlüsselwörtern oder darin enthaltenen Inhalten; Lokalisieren und identifizieren Sie personenbezogene Daten in Dokumenten und erleichtern Sie so die Einhaltung der DSGVO und die effektivere Verwaltung sensibler Informationen. Die Suche innerhalb von Bildern ermöglicht auch die Erstellung automatisierter Arbeitsabläufe und die Optimierung verschiedener Geschäftsprozesse nach Erhalt unterzeichneter Verträge und Rechnungen.

Nach Text in Bildern suchen – C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}