Native OCR-API für .NET-Anwendungen
Bild in C# in Text konvertieren
Weitere Vitrinen >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Warum Aspose.OCR für .NET?
Aspose.OCR für .NET ist eine robuste, entwicklerfreundliche und kostengünstige API für die optische Zeichenerkennung. Mit weniger als 10 Zeilen nativem C#-Code können Sie OCR-Funktionen in Ihre .NET-Desktoplösungen, MVC-basierten Webanwendungen, Cloud-Dienste und serverlosen Azure-Funktionen integrieren. Extrahieren Sie maschinenlesbaren Text aus Scans, Fotos und Screenshots, wandeln Sie gescannte Seiten in durchsuchbare und indizierbare PDFs um, suchen und vergleichen Sie Text auf Bildern, wobei der Schwerpunkt auf geschäftlichen Aufgaben liegt und nicht auf komplexer Mathematik, neuronalen Netzen und anderen technischen Feinheiten. Klicken Sie auf die folgenden Elemente, um mehr über unsere Funktionen und Vorteile zu erfahren.
Globale Anwendungen
Erkennen Sie Texte in lateinischer, kyrillischer und asiatischer Schrift, darunter mehr als 6.000 chinesische Schriftzeichen und Hindi.
Lesen Sie alles
Rufen Sie Text aus jeder Datei ab, die Sie über einen Scanner oder eine Kamera erhalten haben, und verarbeiten Sie Bilder direkt über Weblinks.
Zuverlässige Ergebnisse
Erzielen Sie eine hohe Erkennungsgenauigkeit für alle Bilder, auch für unscharfe, gedrehte, verzerrte und verrauschte Bilder.
Chargenerkennung
Massenerkennung aller Bilder aus Ordnern und Archiven; Lesen Sie mehrseitige PDF-Dokumente und TIFF-Bilder.
Layouterkennung
Identifizieren und kategorisieren Sie Inhaltsblöcke in Bildern, um unabhängig vom Layout die richtige Reihenfolge des extrahierten Texts sicherzustellen.
Live-Codebeispiel
Die optische Zeichenerkennung wird mit Aspose.OCR zu einer trivialen und unkomplizierten Aufgabe, selbst für Entwickler, die mit der Technologie noch nicht vertraut sind. Nur wenige Codezeilen reichen aus, um Text aus einem Bild zu extrahieren und auf dem Bildschirm anzuzeigen. Es ist wirklich so einfach – probieren Sie es aus.
* Durch das Hochladen Ihrer Dateien oder die Nutzung des Dienstes stimmen Sie unserem zu Nutzungsbedingungen Und Datenschutzrichtlinie.
Bild in Text umwandeln
Mehr Beispiele >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Plattformunabhängigkeit
Aspose.OCR für .NET kann auf jeder Plattform arbeiten, die .NET, .NET Core oder .NET Framework unterstützt – egal ob auf einer lokalen Plattform Maschine, auf dem Webserver oder in der Cloud.
Unterstützte Dateiformate
Aspose.OCR for .NET kann mit praktisch jeder [Datei]arbeiten( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse werden in den gängigsten Datei- und Datenaustauschformaten zurückgegeben, die gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden können.
Bilder
- JPEG
- PNG
- TIFF
- BMP
- GIF
Batch-OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Anerkennungsergebnisse
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Für jeden Inhalt geeignet
Die Genauigkeit und Zuverlässigkeit der Texterkennung hängt stark von der Qualität des Originalbildes ab. Aspose.OCR für .NET bietet eine umfangreiche Auswahl an vollautomatischen und manuellen Bildverarbeitungsfiltern, die ein Bild verbessern, bevor es an die OCR-Engine gesendet wird.
Leistungsstarke Bildverarbeitung und anpassbare Algorithmen zur Erkennung der Inhaltsstruktur ermöglichen die Textextraktion aus praktisch jedem Bild, von hochwertigen Scans bis hin zu Straßenfotos. Um die beste Erkennungsqualität zu erzielen, können mehrere Verarbeitungsfilter auf dasselbe Bild angewendet werden.
Ressourcenoptimierung
Aspose.OCR für .NET ermöglicht eine hochflexible Abstimmung von Erkennungsgeschwindigkeit, Qualität und Ressourcennutzung für jeden spezifischen Anwendungsfall:
- Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
- Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie die Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
- Entlasten Sie die CPU, indem Sie die Berechnungen auf die GPU verlagern.
Über 130 Erkennungssprachen
Aspose.OCR für .NET ist eine universelle Lösung für die Dokumentenverarbeitung, Datenextraktion und Inhaltsdigitalisierung auf globaler Ebene. Da es eine Vielzahl europäischer, nahöstlicher und asiatischer Schreibskripte unterstützt, eignet es sich für jede Größenordnung und richtet sich sowohl an kleine und mittlere Unternehmen als auch an multinationale Konzerne.
Sie können die Spracherkennung an die Bibliothek delegieren oder die Sprache manuell angeben und so die Erkennungsleistung und -zuverlässigkeit verbessern. Folgende Sprachen werden unterstützt:
- Erweitertes lateinisches Alphabet: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und über 80 weitere;
- Kyrillisches Alphabet: Russisch, Ukrainisch, Kasachisch, Serbisch, Weißrussisch, Bulgarisch;
- Arabisch, Persisch, Urdu;
- Chinesische und Devanagari-Schrift, einschließlich Hindi, Marathi, Bhojpuri und andere.
Funktionen und Fähigkeiten
Aspose.OCR für .NET extrahiert automatisch Text aus Fotos oder gescannten Bildern, sodass keine manuelle Eingabe von Dokumenten erforderlich ist.
Foto-OCR
Extrahieren Sie Text aus Smartphone-Fotos mit Scan-Genauigkeit.
Durchsuchbares PDF
Wandeln Sie jeden Scan in ein vollständig durchsuchbares und indizierbares Dokument um.
URL-Erkennung
Erkennen Sie ein Bild anhand der URL, ohne es lokal herunterzuladen.
Massenerkennung
Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.
Beliebige Schriftart und Stil
Identifizieren und erkennen Sie Texte in allen gängigen Schriftarten und Stilen.
Feinabstimmung der Erkennung
Passen Sie jeden OCR-Parameter an, um optimale Erkennungsergebnisse zu erzielen.
Rechtschreibprüfung
Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.
Finden Sie Text in Bildern
Suchen Sie nach Text oder regulären Ausdrücken in einer Reihe von Bildern.
Vergleichen Sie Bildtexte
Vergleichen Sie Texte auf zwei Bildern, unabhängig von Groß- und Kleinschreibung und Layout.
Einfach zu verwenden
Sie benötigen nur ein paar Codezeilen, um Bilder in Text umzuwandeln, eine durchsuchbare PDF-Datei zu erstellen, Erkennungsergebnisse in einem Dokument zu speichern und vieles mehr. Erkunden Sie die Codebeispiele, um zu verstehen, wie Sie Aspose.OCR für .NET in Ihre Lösungen integrieren.
Installation
Mit einigen [Einschränkungen]können Sie Aspose.OCR für .NET direkt nach der Installation verwenden ( https://docs.aspose.com/ocr/net/licensing/) . Eine temporäre Lizenz hebt alle Einschränkungen der Testversion für 30 Tage auf. Nutzen Sie es, um mit dem Aufbau einer voll funktionsfähigen OCR-Anwendung zu beginnen und später die endgültige Entscheidung zum Kauf von Aspose.OCR für .NET zu treffen.
Extrahieren Sie Text aus einem Foto
Wenn man normalerweise an OCR (Optical Character Recognition) denkt, denkt man zunächst oft an einen Scanner als primäres Erfassungsgerät. Diese Assoziation hat historische Gründe und ist in vielen Kontexten noch immer weit verbreitet. Sie bietet eine konsistente und kontrollierte Umgebung für die Erfassung gedruckter Texte aus physischen Dokumenten in unübertroffener Qualität. Allerdings handelt es sich bei einem Scanner um ein Spezialgerät, das nicht immer zur Hand ist und für dessen Betrieb ein stationärer Arbeitsplatz erforderlich ist. Glücklicherweise bietet die moderne Welt eine praktische Alternative zu herkömmlichen Scannern – eine Smartphone-Kamera. Die Fortschritte in der Smartphone-Kameratechnologie stellen sicher, dass selbst ein Einsteiger-Smartphone eine ausreichende Qualität bietet, um OCR-fähige Dokumente zu erfassen. Und der integrierte Speicher macht es einfacher als je zuvor, große Mengen an Dokumenten, Zeitungen, Büchern, Straßenschildern und anderen Texten unterwegs zu digitalisieren. Sie benötigen lediglich die richtige Technologie, um diese Fotos in maschinenlesbaren Text umzuwandeln.
Aspose.OCR für .NET wurde speziell für die sofortige Erkennung aller Arten von Bildern entwickelt und kann weiter verfeinert werden, um auch Fotos mit geringer Qualität zu verarbeiten. In Kombination mit einem modernen Smartphone können Sie leistungsstarke OCR-Anwendungen für die meisten alltäglichen Scan- und Texterkennungsaufgaben erstellen. Die fortschrittlichste Bildverarbeitung und Dokumentstrukturanalyse werden in wenigen Codezeilen durchgeführt, sodass Sie sich auf das Geschäft konzentrieren können und nicht auf komplexe mathematische Algorithmen, neuronale Netze und andere technische Feinheiten.
Foto-OCR – C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Erstellen Sie aus dem Scan ein durchsuchbares PDF
PDF ist eines der beliebtesten Formate zum Scannen von Papierdokumenten, insbesondere aufgrund der Möglichkeit, mehrere Seiten in einer einzigen Datei zusammenzufassen. Dieses Format wird häufig für den Austausch von Verträgen, Rechnungen, Rechtsdokumenten, Pässen und Personalausweisen sowie vielen anderen Dokumenten zwischen Einzelpersonen, Unternehmen, Banken und Regierungsbehörden verwendet. Allerdings ist jedes gescannte PDF im Wesentlichen eine Sammlung von Bildern. Es enthält keinen maschinenlesbaren Text, sodass Benutzer den Inhalt des Dokuments nicht durchsuchen, kopieren oder anderweitig manipulieren können.
Aspose.OCR für .NET bietet Ihnen eine schnelle, einfache und äußerst zuverlässige Möglichkeit, jedes gescannte PDF in ein vollständig durchsuchbares und indizierbares Dokument umzuwandeln. Es erkennt Seiteninhalte präzise und wandelt sie in eine maschinenlesbare Textebene über dem Originalbild um, die ausgewählt, kopiert, von Text-to-Speech-Software gelesen und sogar automatisch von Übersetzern, Zusammenfassungen und anderen KI-gestützten Analysen verarbeitet werden kann Werkzeuge.
Textüberlagerung zu PDF hinzufügen – C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Suchen Sie nach Text in Bildern
Digitale Archive, insbesondere in großen Organisationen, bestehen oft aus einer riesigen Sammlung von Scans und Fotos, von denen viele mehrseitige Dokumente enthalten können. Eine effiziente Verwaltung und effektive Organisation solcher Archive ist für den einfachen Informationsabruf und die einfache Navigation unerlässlich. Allerdings enthalten Bilder keinen maschinenlesbaren Text, sodass eine Suche und Analyse des Dokumentinhalts nicht möglich ist.
Aspose.OCR für .NET ermöglicht Ihnen die einfache Suche nach Text in Bildern, unabhängig von Schriftart, Textgröße, Stil und anderen Parametern. Die Bibliothek unterstützt auch Suchvorgänge ohne Berücksichtigung der Groß-/Kleinschreibung und reguläre Ausdrücke, die in verschiedenen Anwendungen und Branchen äußerst nützlich sind. Diese Funktionalität kann zum Kategorisieren von Dokumenten basierend auf dem Inhalt, Schlüsselwörtern oder im Text gefundenen Mustern verwendet werden; Suche nach bestimmten Bedingungen oder Klauseln in Vereinbarungen und Verträgen; Reorganisieren von Dateien basierend auf Schlüsselwörtern oder darin enthaltenen Inhalten; Lokalisieren und identifizieren Sie personenbezogene Daten in Dokumenten und erleichtern Sie so die Einhaltung der DSGVO und die effektivere Verwaltung sensibler Informationen. Die Suche innerhalb von Bildern ermöglicht auch die Erstellung automatisierter Arbeitsabläufe und die Optimierung verschiedener Geschäftsprozesse nach Erhalt unterzeichneter Verträge und Rechnungen.
Nach Text in Bildern suchen – C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}