HTML JPG OCR XML BMP
Aspose.OCR  voor C++
DOCX

Aspose.Imaging voor Java

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in DJVU-indeling en maakt DJVU-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.

Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Met C++ OCR en slechts een paar regels code, kun je een complete applicatie maken die een DJVU afbeelding converteert naar een DOCX document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep de methode AsposeOCR.asposeocr_page() aan
  • Geef het DJVU bestandspad door als parameter
  • AsposeOCR.asposeocr_page retourneert een String of bestand van het type DOCX

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Microsoft.ML.OnnxRuntime 1.7.0 of hoger aan het project is toegevoegd. Het zou automatisch moeten worden geïnstalleerd als u Aspose.OCR installeert via NuGet Package Manager.

  • NET Standard 2.0+ compatibele oplossing
  • Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • DJVU Wat is DJVU Bestandsformaat

    DjVu, uitgesproken als "déjà vu", is een grafisch bestandsformaat dat bedoeld is voor gescande documenten en boeken, met name die welke de combinatie van tekst, tekeningen, afbeeldingen en foto's bevatten. Het is ontwikkeld door AT&T Labs. Het maakt gebruik van meerdere technieken, zoals scheiding van tekst- en achtergrondafbeeldingen in beeldlagen, progressief laden, rekenkundige codering en compressie met verlies voor bitonale afbeeldingen. Omdat het DJVU-bestand gecomprimeerde maar hoogwaardige kleurenafbeeldingen, foto's, tekst en tekeningen kan bevatten en daarom in minder ruimte kan worden opgeslagen, wordt het op internet gebruikt als eBooks, handleidingen, kranten, oude documenten, enz.

    Lees verder

    DOCX Wat is DOCX Bestandsformaat

    DOCX is een bekend formaat voor Microsoft Word-documenten. Geïntroduceerd vanaf 2007 met de release van Microsoft Office 2007, werd de structuur van dit nieuwe documentformaat veranderd van gewoon binair naar een combinatie van XML en binaire bestanden. Docx-bestanden kunnen worden geopend met Word 2007 en laterale versies, maar niet met de eerdere versies van MS Word die DOC-bestandsextensies ondersteunen.

    Lees verder