OCR for C++

OCR for Python via .NET

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for .NET

KI -betriebene C# OCR -Bibliothek für .NET -Anwendungen

.NET OCR -Bibliothek, die 140+ Erkennungssprachen unterstützt, die Text aus Bildern extrahiert und durchsuchbare PDFs mit nur wenigen Zeilen von C# Code erstellt.

Herunterladen Versuch Kaufen

Sehen Sie, was neu ist

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
     = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

> dotnet add package Aspose.OCR

Warum sich die ASPOSE OCR -Bibliothek wählen?

Erstellen Sie leistungsstarke OCR -Funktionen in Sekundenschnelle in Ihre .NET -Apps. Mit unserer benutzerfreundlichen OCR-API können Sie Text aus Bildern und Scans extrahieren, durchsuchbare PDFs erstellen und mehr mit minimalem C# Code. Ideal für .NET -Desktop-, Web-, Cloud- und Serverless -Funktionen.
Erleben Sie OCR, der nicht nur Text extrahiert, sondern sie mit KI versteht und verbessert. Klicken Sie auf die folgenden Elemente, um mehr über unsere Funktionen und Vorteile zu erfahren.

Globale OCR -Anwendungen

C# OCR erkennt englische, kyrillische, arabische, persische, chinesische, japanische, koreanische, hindi-, tamilische und gemischte Texte an.

Lesen Sie alles

Holen Sie sich Text von einer beliebigen Datei, die über einen Scanner oder eine Kamera erhalten wurde, und verarbeiten Sie Bilder direkt von Web -Links.

Zuverlässige Ergebnisse

Erreichen Sie eine hohe Erkennungsgenauigkeit für alle Bilder, einschließlich derjenigen, die außerhalb des Fokus sind, gedreht, verzerrt und laut.

Batch -Anerkennung

Bulk anerkannt alle Bilder aus Ordnern und Archiven; Lesen Sie mehrseitige PDF-Dokumente und TIFF-Bilder.

Layouterkennung

Identifizieren und kategorisieren Sie Inhaltsblöcke in Bildern, um die korrekte Reihenfolge des extrahierten Textes unabhängig vom Layout sicherzustellen.

KI -Nachbearbeitung mit LLMs

Nicht nur OCR-Ihre All-in-One-AI-Lösung für intelligentere, fehlerfreie Texterkennung. ASSOSS.OCR integriert nun KI und LLMs, um Modelle auszuwählen, die die OCR -Genauigkeit erheblich verbessern - Fehler aufnehmen, fehlende Text wiederherstellen und die Gesamterkennungsqualität verbessern.

Live -Code -Beispiel

.NET OCR wird auch für neue Entwickler zu einer trivialen und unkomplizierten Aufgabe mit ASSOSE OCR -API. Nur ein paar Codezeilen reichen aus, um Text aus einem Bild zu extrahieren und auf dem Bildschirm anzuzeigen. Es ist wirklich so einfach - probieren Sie es aus.

Bereit zu erkennen Bereit zu erkennen Lassen Sie hier eine Datei fallen oder klicken Sie, um zu durchsuchen *

* Durch Hochladen Ihrer Dateien oder die Verwendung des Dienstes, den Sie mit unserer zustimmen Nutzungsbedingungen Und Datenschutzrichtlinie.

Erkennungsergebnis

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Plattformunabhängigkeit

Die OCR-Bibliothek für Cross-Platform kann überall unter .NET, .NET CORE oder .NET Framework-ob auf einem lokalen Computer, auf dem Webserver oder in Cloud funktionieren.

Unterstützte Dateiformate

Aspose.OCR for .NET kann mit jeder [Datei]funktionieren( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Sie können von einem Scanner oder einer Kamera erhalten. Erkennungsergebnisse können gespeichert, in eine Datenbank importiert oder in Echtzeit analysiert werden.

Bilder

JPEG
PNG
TIFF
BMP
GIF

Batch OCR

Multi-page PDF
DjVu
ZIP
Folder

Erkennungsergebnisse

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

LLM-betriebene OCR: Die nächste Generation von OCR, die von KI-Sprachmodellen angetrieben wird.

Die Ergebnisgenauigkeit hört bei der Erkennung nicht auf - entsperren Sie die nächste Qualitätsebene, indem Sie den Text mit externen LLMs verfeinern.

Automatisch korrigieren Schreibweise und Grammatik im erkannten Text.
Normalisieren Sie Inkonsistenzen und formatieren Sie Probleme über mehrseitige Scans hinweg.
Anpassen der Erkennungsergebnisse an das subjektspezifische Vokabular mithilfe von prompt gesteuerten Modellen.
Integrieren Sie jede externe LLM -Pipeline in Ihren OCR -Workflow mit nur wenigen Codezeilen.

Geeignet für Inhalte

Die Genauigkeit und Zuverlässigkeit der Texterkennung in C# hängt weitgehend von der Bildqualität ab. .NET OCR bietet einen vollständigen Satz automatisierter und manueller Bildoptimierung, um überlegene Erkennungsergebnisse zu gewährleisten.

Leistungsstarke Bildverarbeitung, vollständig anpassbare Texterkennung, Nachbearbeitung und automatisierte Rechtschreibkorrektur ermöglichen die Textextraktion von jedem Scan oder Foto mit höchster Genauigkeit.

OCR -Ressourcenoptimierung

Die ASPOSE ‘C# OCR -Bibliothek ermöglicht ein hochflexibler Ausgleich von Erkennungsgeschwindigkeit, Qualität und Ressourcenauslastung für jeden bestimmten Anwendungsfall:

Wählen Sie zwischen gründlicher Erkennung und schneller Erkennung.
Geben Sie die Anzahl der für die Erkennung zugewiesenen Threads an oder lassen Sie unsere .NET -OCR -Bibliothek automatisch auf die Anzahl der Prozessorkerne skalieren.
Befreien Sie die CPU, indem Sie die Berechnungen an die GPU abladen.

140+ Erkennungssprachen

Unsere C# OCR -Bibliothek ist eine universelle Lösung für die Verarbeitung, Datenextraktion und die Inhaltsdigitalisierung auf globaler Ebene. Mit Unterstützung für eine Vielzahl europäischer, mittlerer Ost- und asiatischer Schreibskripte ist es für jedes Land und jedes Unternehmen gut angepasst.

Sie können Dokumente erkennen, die in gemischten Sprachen wie chinesisch/englisch, arabisch/französisch oder kyrillisch/englisch geschrieben wurden. Die folgenden Sprachen werden unterstützt:

** erweitertes Latein **: Englisch, Spanisch, Französisch, Indonesisch, Portugiesisch, Deutsch, Vietnamesisch, Türkisch, Italienisch, Polnisch und 80+ mehr;
** Kyrillisch ** Alphabet: Russisch, Ukrainisch, Kasachisch, Bulgarisch, einschließlich gemischter kyrillischer/englischer Texte;
Arabisch, Persisch, Urdu, einschließlich mit Englisch gemischtes Texte;
Chinesisch, Koreanisch, Japanisch, Devanagari und dravidische Sprachen, einschließlich Hindi, Tamil, Marathi und anderen.

Funktionen und Fähigkeiten

C# OCR extrahiert automatisch Text aus Fotos oder Scans, wodurch die manuelle Wiederholung von Dokumenten erforderlich ist.

Foto OCR

Text aus Smartphone-Fotos mit Genauigkeit auf Scanebene extrahieren.

Durchsuchbarer PDF

Konvertieren Sie jeden Scan in ein vollständig durchsuchbares und indexierbares Dokument.

URL -Anerkennung

Erkennen Sie ein Bild von URL, ohne es lokal herunterzuladen.

Massenerkennung

Lesen Sie alle Bilder aus mehrseitigen Dokumenten, Ordnern und Archiven.

Jede Schriftart und jeder Stil

Identifizieren und erkennen Sie Text in allen beliebten Schriftarten und Stilen.

Fein-Tune-Anerkennung

Passen Sie jeden OCR -Parameter für die besten Erkennungsergebnisse an.

Zaubersprüche

Verbessern Sie die Ergebnisse, indem Sie falsch geschriebene Wörter automatisch korrigieren.

Suchen Sie Text in Bildern

Suchen Sie nach Text oder regulärem Ausdruck in einem Satz von Bildern.

Vergleichen Sie Bildtexte

Vergleichen Sie Texte auf zwei Bildern, unabhängig von Fall und Layout.

Korrektur von AI betrieben

Fix fehl erkannte Wörter und Grammatik mit transformatorbasiertem LLM-kein benutzerdefiniertes Training erforderlich.

Semantische Nachbearbeitung

Gehen Sie über die Charaktere hinaus: Verfeinern der lauten OCR -Ausgabe mit LLMs für eine verbesserte Qualität und Sprachnormalisierung.

Plug-in LLM-Pipelines

Schließen Sie externe Sprachmodelle an, um die OCR -Erkennungsfehler zu korrigieren und unvollständigen oder fragmentierten Text wiederherzustellen.

Einfach zu bedienender OCR

Mit unserer C# OCR -API benötigen Sie nur ein paar Zeilen von C# Code, um Bild in Text umzuwandeln, eine durchsuchbare PDF zu erstellen, Erkennungsergebnisse zu speichern, um zu dokumentieren, und vieles mehr. Erforschen Sie die Code -Beispiele, um zu verstehen, wie Sie unsere OCR -API in Ihre .NET -Lösungen integrieren können.

Installation

.NET OCR wird als Nuget -Paket oder als herunterladbare Datei verteilt. Das Paket kann Ihrem Projekt direkt von Microsoft Visual Studio hinzugefügt werden. Installieren Sie es einfach in Ihrem Projekt und Sie sind bereit, Text aus den Bildern zu extrahieren und Erkennungsergebnisse in einem der unterstützten Formate zu speichern. Wenn Ihr System über eine CUDA-fähige GPU verfügt, können Sie die GPU-Accelerated OCR-Engine verwenden, um die Erkennungsleistung erheblich zu steigern.

Sie können gleich nach der Installation mit einigen Einschränkungen ASSOSPS OCR für .NET verwenden. Eine temporäre Lizenz beseitigt alle Einschränkungen der Testversion für 30 Tage. Verwenden Sie es, um eine voll funktionsfähige OCR -Anwendung zu erstellen und die endgültige Entscheidung zu treffen, die OCR später für .NET zu kaufen.

Text aus einem Foto extrahieren

Wenn Menschen typischerweise OCR (optische Charaktererkennung) denken, besteht die erste Assoziation häufig mit einem Scanner als primäres Erfassungsgerät. Dieser Verein hat historische Gründe und ist in vielen Kontexten immer noch weit verbreitet. Dies bietet eine konsistente und kontrollierte Umgebung für die Erfassung gedruckter Text aus physischen Dokumenten mit unübertroffener Qualität. Ein Scanner ist jedoch eine spezielle Ausrüstung, die nicht immer zur Hand ist und eine stationäre Workstation benötigt, um zu arbeiten. Glücklicherweise bietet die moderne Welt eine bequeme Alternative zu traditionellen Scannern - einer Smartphone -Kamera. Die Fortschritte in der Smartphone-Kamera-Technologie stellen sicher, dass selbst ein Einstiegs-Smartphone eine ausreichende Qualität bietet, um OCR-fähige Dokumente zu erfassen. Und ein integriertes Speicher erleichtert es einfacher denn je, große Mengen an Dokumenten, Zeitungen, Büchern, Straßenschildern und anderen Text zu digitalisieren. Alles, was Sie brauchen, ist die richtige Technologie, um diese Fotos in maschinelles Lesbarstext umzuwandeln.

Unsere C# OCR-Bibliothek ist speziell so konzipiert, dass sie alle Arten von Bildern außerhalb des Boxs erkennen und weiter abgestimmt werden können, um selbst die Fotos von geringer Qualität zu verarbeiten. In Kombination mit einem modernen Smartphone können Sie leistungsstarke OCR -Anwendungen für die meisten täglichen Scan- und Texterkennungsaufgaben erstellen. Die fortschrittlichste Bildverarbeitungs- und Dokumentstrukturanalyse wird in einigen Codezeilen durchgeführt, sodass Sie sich eher auf Unternehmen als auf komplexe mathematische Algorithmen, neuronale Netzwerke und andere technische Feinheiten konzentrieren können.

Foto OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Erstellen Sie einen durchsuchbaren PDF aus dem Scan

PDF ist eines der beliebtesten Formate für Scan -Papierdokumente, insbesondere aufgrund der Fähigkeit, mehrere Seiten in einer einzelnen Datei zu kombinieren. Dieses Format wird häufig für den Austausch von Verträgen, Rechnungen, Rechtsdokumenten, Pässen und Ausweiskarten sowie vielen anderen Dokumenten zwischen Einzelpersonen, Unternehmen, Banken und Regierungsbehörden verwendet. Jeder gescannte PDF ist jedoch im Wesentlichen eine Sammlung von Bildern. Es enthält keinen maschinenlesbaren Text, sodass Benutzer den Dokumentinhalt nicht durchsuchen, kopieren oder auf andere Weise manipulieren können.

ASSOSE .NET OCR bietet Ihnen eine schnelle, einfache und sehr zuverlässige Möglichkeit, um alle gescannten PDF in ein vollständig durchsuchbares und indexierbares Dokument umzuwandeln. Es werden Seiteninhalte genau erkannt und in eine maschinenlesbare Textebene über das Originalbild konvertiert, das ausgewählt, kopiert, durch Text-zu-Sprache-Software gelesen und sogar automatisch von Übersetzern, Zusammenfassungen und anderen Analytics-Tools für KI-betriebene AI-betriebene Analyse-Tools verarbeitet werden kann.

Fügen Sie PDF - C# Textüberlagerung hinzu

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Suche nach Text in Bildern

Digitale Archive, insbesondere in großen Organisationen, bestehen häufig aus einer großen Sammlung von Scans und Fotos, von denen viele mehrseitige Dokumente enthalten können. Ein effizientes Management und die Organisation solcher Archive ist effektiv für das einfache Abruf und die Navigation von Informationen von wesentlicher Bedeutung. Bilder enthalten jedoch keinen maschinenlesbaren Text, was es unmöglich macht, Dokumentinhalte zu durchsuchen und zu analysieren.

Mit der C# OCR -Bibliothek können Sie in Bildern problemlos nach Text suchen, unabhängig von Schriftart, Textgröße, Stil und anderen Parametern. Die Bibliothek unterstützt außerdem unempfindliche Suchvorgänge und reguläre Ausdrücke, die in verschiedenen Anwendungen und Branchen äußerst nützlich sind. Diese Funktionalität kann verwendet werden, um Dokumente basierend auf den im Text enthaltenen Inhalten, Schlüsselwörtern oder Mustern zu kategorisieren. Suche nach bestimmten Bedingungen oder Klauseln innerhalb von Vereinbarungen und Verträgen; Umstrukturierung von Dateien basierend auf Schlüsselwörtern oder Inhalten, die in ihnen gefunden wurden; Suchen und identifizieren Sie personenbezogene Daten in Dokumenten und erleichtern Sie es, die Einhaltung der DSGVO zu gewährleisten und vertrauliche Informationen effektiver zu verwalten. Durch die Suche mit Bildern mit Bildern können automatisierte Workflows erstellt und verschiedene Geschäftsprozesse nach Erhalt unterschriebener Verträge und Rechnungen optimiert werden.

Suche nach Text in Bildern - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

KI -Nachverarbeitung mit LLM

Sie können jetzt über die Rohkennung hinausgehen und eine KI-gesteuerte Logik anwenden, um die Textqualität der OCR-Ergebnisse zu verbessern. Große Sprachmodelle (LLMs) können intelligente Rechtschreibfehler korrigieren, Wortgrenzen wiederherstellen, Grammatikregeln anwenden und den Text basierend auf dem Kontext anpassen-etwas, das auf Syntaxbasis bereicherische Rechtschreibgeräte nicht tun können.

Dieser Nachbearbeitungsschritt ist ideal für scans mit geringer Qualität, Fotos mit Hintergrundgeräuschen oder mehrsprachige Dokumente. Sie können jede LLM-Pipeline anschließen, die die grundlegenden Texteingabe/-ausgabe unterstützt, oder die integrierten Smart Correction-Tools von ASOSPE verwenden, um produktionsbereite Ergebnisse zu erzielen.

🧠ai nach der Verarbeitung mit LLM - C#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();