verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im JPEG2000-Format und erstellt JPEG2000-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur Aspose.OCR abrufen.
Maven oder geben Sie die Aspose Maven Repository-Konfiguration an und installieren Sie es in Ihrem Maven-basierten Projekt, indem Sie die folgenden Konfigurationen zu pom.xml hinzufügen. Beispiele für Graddle, Ivy und Sbt finden Sie in unserem [Repository] ( https://repository.aspose.com/ocr/ ) .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Mit C++ OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein JPEG2000-Bild in ein DOCX-Dokument konvertiert:
- Erstellen Sie eine Instanz der Klasse AsposeOcr
- Rufen Sie die Methode AsposeOCR.asposeocr_page() auf
- Übergeben Sie den Dateipfad JPEG2000 als Parameter
- AsposeOCR.asposeocr_page gibt einen String oder eine Datei vom Typ DOCX zurück
System Anforderungen
Stellen Sie vor dem Ausführen des Beispiels sicher, dass Microsoft.ML.OnnxRuntime 1.7.0 oder höher zum Projekt hinzugefügt wird. Es sollte automatisch installiert werden, wenn Sie Aspose.OCR über den NuGet Package Manager installieren.
- NET Standard 2.0+ kompatible Lösung
- Aspose.OCR für .NET, auf das in Ihrem Projekt verwiesen wird.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
JPEG2000 Was ist JPEG2000 Datei Format
JPEG 2000 (JP2) ist ein Bildcodierungssystem und ein hochmoderner Bildkomprimierungsstandard. JPEG 2000 wurde unter Verwendung der Wavelet-Technologie entwickelt und kann verlustfreie Inhalte in jeder Qualität gleichzeitig kodieren. Darüber hinaus hat JPEG 2000 ohne wesentliche Einbußen bei der Codierungseffizienz die Fähigkeit, auf denselben Inhalt zuzugreifen und ihn effizient in eine Vielzahl anderer Auflösungen und Qualitäten zu decodieren. Die Codeströme in JPEG 2000 sind erheblich skalierbar, da sie interessierende Regionen aufweisen, die die Möglichkeit für einen räumlichen Direktzugriff bereitstellen. Besitzt bis zu 16384 verschiedene Komponenten mit Abmessungen in Terapixel und einer Genauigkeit, die bis zu 38 Bit/Sample betragen kann.
WeiterlesenDOCX Was ist DOCX Datei Format
DOCX ist ein bekanntes Format für Microsoft Word-Dokumente. Die Struktur dieses neuen Dokumentformats, das 2007 mit der Veröffentlichung von Microsoft Office 2007 eingeführt wurde, wurde von einer reinen Binärdatei in eine Kombination aus XML- und Binärdateien geändert. Docx-Dateien können mit Word 2007 und späteren Versionen geöffnet werden, jedoch nicht mit früheren Versionen von MS Word, die DOC-Dateierweiterungen unterstützen.
Weiterlesen