HTML JPG OCR XML BMP
Aspose.OCR  voor .NET
DOCX

Converteer DJVU naar DOCX in C#

Voer optische tekenherkenning uit op het DJVU-document en sla de tekst op als DJVU-document met behulp van Aspose.OCR uit de .NET-bibliotheek.

Hoe DJVU naar DOCX te converteren met C#

Aspose.OCR voor .NET is een krachtige maar gebruiksvriendelijke en kosteneffectieve bibliotheek voor het converteren van DJVU-afbeeldingen naar DOCX-documenten. De ultramoderne optische tekenherkenningsengine ondersteunt 26 talen op basis van Latijn, Cyrillisch en Chinees en biedt superieure herkenningssnelheid en nauwkeurigheid, terwijl u wordt geïsoleerd van formules, neurale netwerken en andere complexe technische details. Hiermee kunt u OCR-functionaliteit toevoegen aan uw .NET-toepassingen in minder dan 10 regels code.

Aspose.OCR voor .NET

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in DJVU-indeling en maakt DJVU-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar de Aspose.OCR te installeren

NuGet

pakket in uw project met de volgende opdracht:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Stappen om DJVU naar DOCX te converteren

Met .NET OCR en slechts een paar regels code, kunt u een complete toepassing maken die een DJVU-afbeelding converteert naar een DOCX-document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep AsposeOCR.RecognizeImage-methode aan
  • Geef het DJVU bestandspad door als parameter
  • AsposeOCR.RecognizeImage retourneert een String of bestand van het type DOCX

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat .NET API die compatibel is met de NET Standard 2.0-specificatie is geïnstalleerd op uw systeem en op alle [externe afhankelijkheden]( https://docs.aspose.com/ocr/net/system-requirements/#external- afhankelijkheden) van het Aspose.OCR-pakket worden verwezen in uw project.

  • NET Standard 2.0+ compatibele oplossing
  • Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.

Deze voorbeeldcode toont DJVU naar DOCX .NET Conversie


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOCX", riText);
  • DJVU Wat is DJVU Bestandsformaat

    DjVu, uitgesproken als "déjà vu", is een grafisch bestandsformaat dat bedoeld is voor gescande documenten en boeken, met name die welke de combinatie van tekst, tekeningen, afbeeldingen en foto's bevatten. Het is ontwikkeld door AT&T Labs. Het maakt gebruik van meerdere technieken, zoals scheiding van tekst- en achtergrondafbeeldingen in beeldlagen, progressief laden, rekenkundige codering en compressie met verlies voor bitonale afbeeldingen. Omdat het DJVU-bestand gecomprimeerde maar hoogwaardige kleurenafbeeldingen, foto's, tekst en tekeningen kan bevatten en daarom in minder ruimte kan worden opgeslagen, wordt het op internet gebruikt als eBooks, handleidingen, kranten, oude documenten, enz.

    Lees verder

    DOCX Wat is DOCX Bestandsformaat

    DOCX is een bekend formaat voor Microsoft Word-documenten. Geïntroduceerd vanaf 2007 met de release van Microsoft Office 2007, werd de structuur van dit nieuwe documentformaat veranderd van gewoon binair naar een combinatie van XML en binaire bestanden. Docx-bestanden kunnen worden geopend met Word 2007 en laterale versies, maar niet met de eerdere versies van MS Word die DOC-bestandsextensies ondersteunen.

    Lees verder

    Andere ondersteunde conversies

    Met C# kan men gemakkelijk verschillende formaten converteren, waaronder.

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)
    XML (Uitbreidbare opmaaktaal)
    JSON (JavaScript-objectnotatie)