Konvertieren Sie Bilder und PDFs in Text in C++

Fügen Sie Ihren C++-Anwendungen mit wenigen Codezeilen die optische Zeichenerkennung (OCR) hinzu.

Aspose.OCR für C++ erweitert Ihre Anwendungen mit Funktionen zur optischen Zeichenerkennung in 5 Codezeilen. Unsere Erfahrung mit neuronalen Netzen und maschinellem Lernen wurde in eine OCR-Bibliothek mit überlegener Leistung und Genauigkeit übersetzt, die 26 Sprachen basierend auf lateinischen und kyrillischen Schriften sowie Chinesisch unterstützt. Die OCR-API kann gescannte Bilder, Smartphone-Fotos, Screenshots, Bildbereiche und gescannte PDFs erkennen und Ergebnisse in den gängigsten Dokumenten- und Datenaustauschformaten zurückgeben. Es ist vollständig offline und benötigt keine Internetverbindung, um zu funktionieren. Die API erfordert minimalen Aufwand für den Einstieg und eine flache Lernkurve, um sie zu meistern. Die gesamte Vorverarbeitung, Schräglagenkorrektur, Rauschunterdrückung, Spracherkennung, Multi-Threading und andere komplexe Aufgaben werden automatisch durchgeführt, können aber für schwierige Fälle angepasst werden.

Auf einen Blick

Eine kurze Zusammenfassung der Möglichkeiten der optischen Zeichenerkennung.

Kernfunktionen

Text aus Fotos extrahieren
Erstellen Sie durchsuchbare PDFs
Automatische Bildkorrekturen
Unterstützt mehrere Schriftarten
Textformatierung beibehalten
Textfragmente erkennen
Stapelverarbeitung
Rechtschreibprüfung

Unterstützte Sprachen

Englische Sprache
chinesische Sprache
deutsche Sprache
französisch Sprache
italienische Sprache
spanische Sprache
russische Sprache
Tschechische Sprache
Polnische Sprache
ukrainische Sprache
niederländische Sprache
Estnische Sprache
und 10+ mehr

Aspose.OCR

Plattformunabhängigkeit

Die OCR-Bibliothek unterstützt vollständig C++-Anwendungen für Windows und Linux.

Windows 64 bit

Linux 64 bit

Aspose.OCR

Unterstützte Dateiformate

Konvertieren Sie jede Datei, die Sie von einem Scanner oder einer Kamera erhalten, in die gängigsten Dokumenten- und Datenaustauschformate.

Quelldaten

PDF
JPEG
PNG
TIFF
BMP

Erkennungsergebnisse

Durchsuchbares PDF
Microsoft Word
Microsoft Excel
Klartext
JSON
XML

Aspose.OCR

Erweiterte C++ OCR-API-Funktionen

Extrahiert Text aus Bildern und erstellt durchsuchbare PDFs

Unterstützt jedes Bild, das Sie von einem Scanner oder einer Kamera erhalten können

Liest erweiterte lateinische und kyrillische Schriften

Erkennt über 6.000 chinesische Schriftzeichen

Erkennt und erkennt alle gängigen Schriftarten und Formatierungen

Vorverarbeitete Bilder vor der Erkennung

Verarbeitet das gesamte Bild oder nur ausgewählte Bereiche

Unterstützt gedrehte, verzerrte und verrauschte Bilder

Stapelerkennung aller Bilder in einem Ordner oder Archiv

Erkennt Bilder, die als Weblinks bereitgestellt werden

Findet und korrigiert automatisch falsch geschriebene Wörter

Erkennungsergebnis als JSON abrufen

Einfach zu verwenden

Glauben Sie immer noch, dass C++ OCR schwierig ist? Mit unserer Bibliothek benötigen Sie nur 5 Zeilen Code, um das Bild zu erkennen und das Ergebnis anzuzeigen. Probieren Sie diesen Code aus und überzeugen Sie sich selbst:

Bild zu Text in 5 Zeilen - C++

// Bildpfad angeben
std::string image_path = "../Data/Source/sample.png";

// Bereiten Sie einen Puffer für das Ergebnis vor
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Machen Sie die Magie
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Zeigen Sie das Erkennungsergebnis an
std::wcout << buffer << L"\n";

26 Anerkennungssprachen

Die OCR-API kann eine große Anzahl von Sprachen und alle gängigen Schreibschriften erkennen, einschließlich Texte mit gemischten Sprachen.

Erweitertes lateinisches Alphabet : Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch.
Kyrillisches Alphabet : Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch.
Chinesisch : mehr als 6.000 Zeichen.

Sie können die Spracherkennung der Bibliothek überlassen oder die Sprache selbst definieren, um die Erkennungsleistung und -zuverlässigkeit zu erhöhen.

Stapelverarbeitung

Die OCR-API befreit Sie davon, jedes Bild einzeln zu erkennen, indem sie verschiedene Stapelverarbeitungsmethoden anbietet, mit denen Sie mehrere Bilder in einem Aufruf erkennen können:

Erkennung mehrseitiger PDF- und TIFF-Dateien.
Erkennung aller Dateien in einem Ordner.
Erkennung aller Dateien in einem Archiv.

ZIP-Archiv erkennen - C++

// Archivpfad angeben
std::string archive_path = "book.zip";

// Bereiten Sie einen Puffer für das Ergebnis vor
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// RecognitionSettings-Objekt mit Standardwerten initialisieren
RecognitionSettings settings;

// Erkenne
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Formatierung beibehalten

Die OCR-Bibliothek liest alle gängigen Schriftarten wie Arial, Times New Roman, Courier New, Tahoma, Calibri und mehr in normaler, fetter und kursiver Schrift und behält die Formatierung in OCR-Ergebnissen sorgfältig bei. Sie können die Erkennungsergebnisse auch in Zeilen aufteilen und Textbereiche auf einer Seite erkennen.

Fotos erkennen

Die weite Verbreitung von OCR-Anwendungen wird normalerweise dadurch gestoppt, dass Scanner für die meisten Benutzer nicht alltäglich sind. Unsere OCR-Bibliothek verfügt über leistungsstarke integrierte Bildvorverarbeitungsfilter, die dunkle, gedrehte, schiefe und verrauschte Bilder verarbeiten können. In Kombination mit der Unterstützung aller Bildformate ermöglicht es eine zuverlässige Erkennung sogar von Smartphone-Fotos. Der größte Teil der Vorverarbeitung und Bildkorrektur erfolgt automatisch, sodass Sie nur in schwierigen Fällen eingreifen müssen.

Legen Sie einen benutzerdefinierten Winkel für die Schräglaufkorrektur fest - C++

// Original Bild
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Bereiten Sie einen Puffer für das Ergebnis vor
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Passen Sie den Neigungswinkel an
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Bild erkennen
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Rechtschreibprüfung

Während die OCR zuverlässige Ergebnisse liefert, können Staub- und Druckfehler dazu führen, dass einige Symbole falsch erkannt werden. Die OCR-API verfügt über eine integrierte Rechtschreibprüfung, die falsch geschriebene Wörter automatisch ersetzt und Sie davon befreit, die Erkennungsergebnisse manuell korrigieren zu müssen.

Support and Learning Resources

Warum Aspose.OCR für C++?
Kundenliste
Erfolgsgeschichten

Download Free Trial Pricing Information

Aspose bietet auch native OCR-APIs für andere gängige Programmiersprachen:

Konvertieren Sie Bilder und PDFs in Text in C++

Fügen Sie Ihren C++-Anwendungen mit wenigen Codezeilen die optische Zeichenerkennung (OCR) hinzu.

Aspose.OCR for C++

Overview

Auf einen Blick

Plattformunabhängigkeit

Unterstützte Dateiformate

Erweiterte C++ OCR-API-Funktionen

Einfach zu verwenden

Bild zu Text in 5 Zeilen - C++

26 Anerkennungssprachen

Stapelverarbeitung

ZIP-Archiv erkennen - C++

Formatierung beibehalten

Fotos erkennen

Legen Sie einen benutzerdefinierten Winkel für die Schräglaufkorrektur fest - C++

Rechtschreibprüfung

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava