HTML JPG OCR XML BMP
Aspose.OCR  für C++
DOC

Aspose.Imaging für Java

verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im JPG-Format und erstellt JPG-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur Aspose.OCR abrufen.

Maven oder geben Sie die Aspose Maven Repository-Konfiguration an und installieren Sie es in Ihrem Maven-basierten Projekt, indem Sie die folgenden Konfigurationen zu pom.xml hinzufügen. Beispiele für Graddle, Ivy und Sbt finden Sie in unserem [Repository] ( https://repository.aspose.com/ocr/ ) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Mit C++ OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein JPG-Bild in ein DOC-Dokument konvertiert:

  • Erstellen Sie eine Instanz der Klasse AsposeOcr
  • Rufen Sie die Methode AsposeOCR.asposeocr_page() auf
  • Übergeben Sie den Dateipfad JPG als Parameter
  • AsposeOCR.asposeocr_page gibt einen String oder eine Datei vom Typ DOC zurück

System Anforderungen

Stellen Sie vor dem Ausführen des Beispiels sicher, dass Microsoft.ML.OnnxRuntime 1.7.0 oder höher zum Projekt hinzugefügt wird. Es sollte automatisch installiert werden, wenn Sie Aspose.OCR über den NuGet Package Manager installieren.

  • NET Standard 2.0+ kompatible Lösung
  • Aspose.OCR für .NET, auf das in Ihrem Projekt verwiesen wird.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JPG Was ist JPG Datei Format

    Ein JPEG ist ein Bildformat, das mit der Methode der verlustbehafteten Komprimierung gespeichert wird. Das Ausgabebild ist als Ergebnis der Komprimierung ein Kompromiss zwischen Speichergröße und Bildqualität. Benutzer können die Komprimierungsstufe anpassen, um die gewünschte Qualitätsstufe zu erreichen, während gleichzeitig die Speichergröße reduziert wird. Die Bildqualität wird vernachlässigbar beeinträchtigt, wenn eine 10:1-Komprimierung auf das Bild angewendet wird. Je höher der Komprimierungswert, desto stärker die Verschlechterung der Bildqualität.

    Weiterlesen

    DOC Was ist DOC Datei Format

    Dateien mit der Erweiterung .doc stellen Dokumente dar, die von Microsoft Word oder anderen Textverarbeitungsdokumenten im Binärdateiformat generiert wurden. Die Erweiterung wurde ursprünglich für die Klartextdokumentation auf mehreren verschiedenen Betriebssystemen verwendet. Es kann verschiedene Arten von Daten enthalten, z. B. Bilder, formatierten sowie einfachen Text, Grafiken, Diagramme, eingebettete Objekte, Links, Seiten, Seitenformatierung, Druckeinstellungen und vieles mehr. Das Format war beliebt für alle Arten von Dokumentationen, da es den Benutzern eine Vielzahl von Optionen zum Schreiben von Handbüchern, Angeboten, Spezifikationen, Lebensläufen, Artikeln oder ähnlichen Dokumenten bietet. Die aktualisierte Version von DOC ist DOCX, das auf Office OpenXML basiert, dessen Spezifikationen offen verfügbar sind.

    Weiterlesen

    TXT (Textdokumentdatei)
    Text (Textdokumentdatei)
    DOC (Von Microsoft Word generierte Dokumente)
    DOCX (Microsoft Word-Dokumente)
    XLS (Binäres Dateiformat von Microsoft Excel)
    XLSX (Microsoft Excel-Dokumente)
    PDF (Portables Dokumentenformat (PDF))
    Searchable PDF (Durchsuchbare tragbare Netzwerkgrafiken)