HTML JPG OCR XML BMP
Aspose.OCR  voor C++
XLSX

Aspose.Imaging voor Java

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in JPEG2000-indeling en maakt JPEG2000-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.

Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Met C++ OCR en slechts een paar regels code, kun je een complete applicatie maken die een JPEG2000 afbeelding converteert naar een XLSX document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep de methode AsposeOCR.asposeocr_page() aan
  • Geef het JPEG2000 bestandspad door als parameter
  • AsposeOCR.asposeocr_page retourneert een String of bestand van het type XLSX

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Microsoft.ML.OnnxRuntime 1.7.0 of hoger aan het project is toegevoegd. Het zou automatisch moeten worden geïnstalleerd als u Aspose.OCR installeert via NuGet Package Manager.

  • NET Standard 2.0+ compatibele oplossing
  • Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JPEG2000 Wat is JPEG2000 Bestandsformaat

    JPEG 2000 (JP2) is een beeldcoderingssysteem en de modernste beeldcompressiestandaard. Ontworpen, met behulp van wavelet-technologie, kan JPEG 2000 verliesvrije inhoud in elke kwaliteit tegelijk coderen. Bovendien heeft JPEG 2000, zonder enige substantiële schade aan de coderingsefficiëntie, de mogelijkheid om dezelfde inhoud op doeltreffende wijze te openen en te decoderen in een verscheidenheid aan andere resoluties en kwaliteiten. De codestromen in JPEG 2000 zijn aanzienlijk schaalbaar met interessegebieden die de mogelijkheid bieden voor ruimtelijke willekeurige toegang. Met tot 16384 verschillende componenten met afmetingen in terapixels en een precisie die kan oplopen tot 38 bits/sample.

    Lees verder

    XLSX Wat is XLSX Bestandsformaat

    XLSX is een bekende indeling voor Microsoft Excel-documenten die door Microsoft is geïntroduceerd met de release van Microsoft Office 2007. Gebaseerd op de structuur die is georganiseerd volgens de Open Packaging Conventions zoals uiteengezet in deel 2 van de OOXML-standaard ECMA-376, is de nieuwe indeling een zip-pakket dat een aantal XML-bestanden bevat. De onderliggende structuur en bestanden kunnen worden onderzocht door het .xlsx-bestand eenvoudig uit te pakken.

    Lees verder

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)