HTML JPG OCR XML BMP
Aspose.OCR  für .NET
XML

Konvertieren Sie DJVU in XML in C#

Führen Sie eine optische Zeichenerkennung für das DJVU-Dokument durch und speichern Sie Text als DJVU-Dokument mit Aspose.OCR aus der .NET-Bibliothek.

So konvertieren Sie DJVU in XML mit C#

Aspose.OCR für .NET ist eine leistungsstarke, aber benutzerfreundliche und kostengünstige Bibliothek zum Konvertieren von DJVU-Bildern in XML-Dokumente. Die hochmoderne optische Zeichenerkennungs-Engine unterstützt 26 Sprachen basierend auf Latein, Kyrillisch und Chinesisch und bietet eine überlegene Erkennungsgeschwindigkeit und -genauigkeit, während Sie von Formeln, neuronalen Netzwerken und anderen komplexen technischen Details isoliert werden. Es ermöglicht Ihnen, OCR-Funktionalität zu Ihren .NET-Anwendungen in weniger als 10 Codezeilen hinzuzufügen.

Aspose.OCR für .NET

verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im DJVU-Format und erstellt DJVU-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur die Datei Aspose.OCR installieren.

NuGet

Paket in Ihrem Projekt mit dem folgenden Befehl:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Schritte zum Konvertieren von DJVU in XML

Mit .NET OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein DJVU-Bild in ein XML-Dokument konvertiert:

  • Erstellen Sie eine Instanz der Klasse AsposeOcr
  • Rufen Sie die Methode AsposeOCR.RecognizeImage auf
  • Übergeben Sie den Dateipfad DJVU als Parameter
  • AsposeOCR.RecognizeImage gibt einen String oder eine Datei vom Typ XML zurück

System Anforderungen

Stellen Sie vor dem Ausführen des Beispiels sicher, dass die mit der NET Standard 2.0-Spezifikation kompatible .NET-API auf Ihrem System installiert ist und alle [externen Abhängigkeiten]( https://docs.aspose.com/ocr/net/system-requirements/#external- Abhängigkeiten) des Aspose.OCR-Pakets werden in Ihrem Projekt referenziert.

  • NET Standard 2.0+ kompatible Lösung
  • Aspose.OCR für .NET, auf das in Ihrem Projekt verwiesen wird.

Dieser Beispielcode zeigt die Konvertierung von DJVU in XML .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.XML", riText);
  • DJVU Was ist DJVU Datei Format

    DjVu, ausgesprochen als „déjà vu“, ist ein Grafikdateiformat, das für gescannte Dokumente und Bücher gedacht ist, insbesondere für solche, die eine Kombination aus Text, Zeichnungen, Bildern und Fotos enthalten. Es wurde von AT&T Labs entwickelt. Es verwendet mehrere Techniken wie Bildebenentrennung von Text und Hintergrundbildern, progressives Laden, arithmetische Codierung und verlustbehaftete Komprimierung für bitonale Bilder. Da die DJVU-Datei komprimierte, aber qualitativ hochwertige Farbbilder, Fotos, Texte und Zeichnungen enthalten kann und daher auf weniger Platz gespeichert werden kann, wird sie im Internet als eBooks, Handbücher, Zeitungen, alte Dokumente usw. verwendet.

    Weiterlesen

    XML Was ist XML Datei Format

    XML steht für Extensible Markup Language, die HTML ähnlich ist, sich jedoch in der Verwendung von Tags zum Definieren von Objekten unterscheidet. Die Grundidee hinter der Erstellung des XML-Dateiformats bestand darin, Daten zu speichern und zu transportieren, ohne von Software- oder Hardware-Tools abhängig zu sein. Seine Popularität ist darauf zurückzuführen, dass es sowohl von Menschen als auch von Maschinen lesbar ist. Dies ermöglicht es ihm, gemeinsame Datenprotokolle in Form von Objekten zu erstellen, die gespeichert und über ein Netzwerk wie das World Wide Web (WWW) geteilt werden. Das „X“ in XML steht für erweiterbar, was bedeutet, dass die Sprache gemäß den Benutzeranforderungen auf eine beliebige Anzahl von Symbolen erweitert werden kann. Für diese Funktionen nutzen viele Standarddateiformate wie Microsoft Open XML, LibreOffice OpenDocument, XHTML und SVG.

    Weiterlesen

    Andere unterstützte Konvertierungen

    Mit C# kann man problemlos verschiedene Formate konvertieren, einschließlich.

    TXT (Textdokumentdatei)
    Text (Textdokumentdatei)
    DOC (Von Microsoft Word generierte Dokumente)
    DOCX (Microsoft Word-Dokumente)
    XLS (Binäres Dateiformat von Microsoft Excel)
    XLSX (Microsoft Excel-Dokumente)
    PDF (Portables Dokumentenformat (PDF))
    Searchable PDF (Durchsuchbare tragbare Netzwerkgrafiken)
    XML (Erweiterbare Auszeichnungssprache)
    JSON (JavaScript-Objekt-Notation)