HTML JPG OCR XML BMP
Aspose.OCR  für C++
Searchable PDF

Aspose.Imaging für Java

verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im DJVU-Format und erstellt DJVU-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur Aspose.OCR abrufen.

Maven oder geben Sie die Aspose Maven Repository-Konfiguration an und installieren Sie es in Ihrem Maven-basierten Projekt, indem Sie die folgenden Konfigurationen zu pom.xml hinzufügen. Beispiele für Graddle, Ivy und Sbt finden Sie in unserem [Repository] ( https://repository.aspose.com/ocr/ ) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Mit C++ OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein DJVU-Bild in ein Searchable PDF-Dokument konvertiert:

  • Erstellen Sie eine Instanz der Klasse AsposeOcr
  • Rufen Sie die Methode AsposeOCR.asposeocr_page() auf
  • Übergeben Sie den Dateipfad DJVU als Parameter
  • AsposeOCR.asposeocr_page gibt einen String oder eine Datei vom Typ Searchable PDF zurück

System Anforderungen

Stellen Sie vor dem Ausführen des Beispiels sicher, dass Microsoft.ML.OnnxRuntime 1.7.0 oder höher zum Projekt hinzugefügt wird. Es sollte automatisch installiert werden, wenn Sie Aspose.OCR über den NuGet Package Manager installieren.

  • NET Standard 2.0+ kompatible Lösung
  • Aspose.OCR für .NET, auf das in Ihrem Projekt verwiesen wird.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • DJVU Was ist DJVU Datei Format

    DjVu, ausgesprochen als „déjà vu“, ist ein Grafikdateiformat, das für gescannte Dokumente und Bücher gedacht ist, insbesondere für solche, die eine Kombination aus Text, Zeichnungen, Bildern und Fotos enthalten. Es wurde von AT&T Labs entwickelt. Es verwendet mehrere Techniken wie Bildebenentrennung von Text und Hintergrundbildern, progressives Laden, arithmetische Codierung und verlustbehaftete Komprimierung für bitonale Bilder. Da die DJVU-Datei komprimierte, aber qualitativ hochwertige Farbbilder, Fotos, Texte und Zeichnungen enthalten kann und daher auf weniger Platz gespeichert werden kann, wird sie im Internet als eBooks, Handbücher, Zeitungen, alte Dokumente usw. verwendet.

    Weiterlesen

    Searchable PDF Was ist Searchable PDF Datei Format

    Durchsuchbare PDF-Dateien behalten das gescannte Originalbild zur Anzeige sowie OCR-Text in einer verborgenen Ebene bei, die für die Volltextsuche in einem Dokument oder zum Hervorheben von Text zum Kopieren und Einfügen verwendet werden kann. Die vollständige OCR-Konvertierung in PDF, ohne das Originalbild, wird niemals 100 % der Originalformatierung beibehalten, insbesondere wenn das Dokument viele Bilder oder ein komplexes Layout enthält.

    Weiterlesen