Aspose.OCR  for C++

Konvertieren Sie Bilder und PDFs in Text in C++

Fügen Sie Ihren C++-Anwendungen mit wenigen Codezeilen die optische Zeichenerkennung (OCR) hinzu.

  Download Free Trial
  
 

Aspose.OCR für C++ erweitert Ihre Anwendungen mit Funktionen zur optischen Zeichenerkennung in 5 Codezeilen. Unsere Erfahrung mit neuronalen Netzen und maschinellem Lernen wurde in eine OCR-Bibliothek mit überlegener Leistung und Genauigkeit übersetzt, die 26 Sprachen basierend auf lateinischen und kyrillischen Schriften sowie Chinesisch unterstützt. Die OCR-API kann gescannte Bilder, Smartphone-Fotos, Screenshots, Bildbereiche und gescannte PDFs erkennen und Ergebnisse in den gängigsten Dokumenten- und Datenaustauschformaten zurückgeben. Es ist vollständig offline und benötigt keine Internetverbindung, um zu funktionieren. Die API erfordert minimalen Aufwand für den Einstieg und eine flache Lernkurve, um sie zu meistern. Die gesamte Vorverarbeitung, Schräglagenkorrektur, Rauschunterdrückung, Spracherkennung, Multi-Threading und andere komplexe Aufgaben werden automatisch durchgeführt, können aber für schwierige Fälle angepasst werden.

Erweiterte C++ OCR-API-Funktionen

Extrahiert Text aus Bildern und erstellt durchsuchbare PDFs

Unterstützt jedes Bild, das Sie von einem Scanner oder einer Kamera erhalten können

Liest erweiterte lateinische und kyrillische Schriften

Erkennt über 6.000 chinesische Schriftzeichen

Erkennt und erkennt alle gängigen Schriftarten und Formatierungen

Vorverarbeitete Bilder vor der Erkennung

Verarbeitet das gesamte Bild oder nur ausgewählte Bereiche

Unterstützt gedrehte, verzerrte und verrauschte Bilder

Stapelerkennung aller Bilder in einem Ordner oder Archiv

Erkennt Bilder, die als Weblinks bereitgestellt werden

Findet und korrigiert automatisch falsch geschriebene Wörter

Erkennungsergebnis als JSON abrufen

Einfach zu verwenden

Glauben Sie immer noch, dass C++ OCR schwierig ist? Mit unserer Bibliothek benötigen Sie nur 5 Zeilen Code, um das Bild zu erkennen und das Ergebnis anzuzeigen. Probieren Sie diesen Code aus und überzeugen Sie sich selbst:

Bild zu Text in 5 Zeilen - C++

// Bildpfad angeben
std::string image_path = "../Data/Source/sample.png";

// Bereiten Sie einen Puffer für das Ergebnis vor
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Machen Sie die Magie
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Zeigen Sie das Erkennungsergebnis an
std::wcout << buffer << L"\n";

26 Anerkennungssprachen

Die OCR-API kann eine große Anzahl von Sprachen und alle gängigen Schreibschriften erkennen, einschließlich Texte mit gemischten Sprachen.

  • Erweitertes lateinisches Alphabet : Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Italienisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch.
  • Kyrillisches Alphabet : Weißrussisch, Bulgarisch, Kasachisch, Russisch, Serbisch, Ukrainisch.
  • Chinesisch : mehr als 6.000 Zeichen.

Sie können die Spracherkennung der Bibliothek überlassen oder die Sprache selbst definieren, um die Erkennungsleistung und -zuverlässigkeit zu erhöhen.

Stapelverarbeitung

Die OCR-API befreit Sie davon, jedes Bild einzeln zu erkennen, indem sie verschiedene Stapelverarbeitungsmethoden anbietet, mit denen Sie mehrere Bilder in einem Aufruf erkennen können:

  • Erkennung mehrseitiger PDF- und TIFF-Dateien.
  • Erkennung aller Dateien in einem Ordner.
  • Erkennung aller Dateien in einem Archiv.

ZIP-Archiv erkennen - C++

// Archivpfad angeben
std::string archive_path = "book.zip";

// Bereiten Sie einen Puffer für das Ergebnis vor
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// RecognitionSettings-Objekt mit Standardwerten initialisieren
RecognitionSettings settings;

// Erkenne
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Formatierung beibehalten

Die OCR-Bibliothek liest alle gängigen Schriftarten wie Arial, Times New Roman, Courier New, Tahoma, Calibri und mehr in normaler, fetter und kursiver Schrift und behält die Formatierung in OCR-Ergebnissen sorgfältig bei. Sie können die Erkennungsergebnisse auch in Zeilen aufteilen und Textbereiche auf einer Seite erkennen.

Fotos erkennen

Die weite Verbreitung von OCR-Anwendungen wird normalerweise dadurch gestoppt, dass Scanner für die meisten Benutzer nicht alltäglich sind. Unsere OCR-Bibliothek verfügt über leistungsstarke integrierte Bildvorverarbeitungsfilter, die dunkle, gedrehte, schiefe und verrauschte Bilder verarbeiten können. In Kombination mit der Unterstützung aller Bildformate ermöglicht es eine zuverlässige Erkennung sogar von Smartphone-Fotos. Der größte Teil der Vorverarbeitung und Bildkorrektur erfolgt automatisch, sodass Sie nur in schwierigen Fällen eingreifen müssen.

Legen Sie einen benutzerdefinierten Winkel für die Schräglaufkorrektur fest - C++

// Original Bild
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Bereiten Sie einen Puffer für das Ergebnis vor
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Passen Sie den Neigungswinkel an
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Bild erkennen
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Rechtschreibprüfung

Während die OCR zuverlässige Ergebnisse liefert, können Staub- und Druckfehler dazu führen, dass einige Symbole falsch erkannt werden. Die OCR-API verfügt über eine integrierte Rechtschreibprüfung, die falsch geschriebene Wörter automatisch ersetzt und Sie davon befreit, die Erkennungsergebnisse manuell korrigieren zu müssen.

  
  

Aspose bietet auch native OCR-APIs für andere gängige Programmiersprachen: