HTML JPG OCR XML BMP
Aspose.OCR  voor C++
DOC

Aspose.Imaging voor Java

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in JPEG-indeling en maakt JPEG-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.

Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Met C++ OCR en slechts een paar regels code, kun je een complete applicatie maken die een JPEG afbeelding converteert naar een DOC document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep de methode AsposeOCR.asposeocr_page() aan
  • Geef het JPEG bestandspad door als parameter
  • AsposeOCR.asposeocr_page retourneert een String of bestand van het type DOC

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Microsoft.ML.OnnxRuntime 1.7.0 of hoger aan het project is toegevoegd. Het zou automatisch moeten worden geïnstalleerd als u Aspose.OCR installeert via NuGet Package Manager.

  • NET Standard 2.0+ compatibele oplossing
  • Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JPEG Wat is JPEG Bestandsformaat

    Een JPEG is een type afbeeldingsformaat dat wordt opgeslagen met de methode van compressie met verlies. Het uitvoerbeeld, als resultaat van compressie, is een afweging tussen opslaggrootte en beeldkwaliteit. Gebruikers kunnen het compressieniveau aanpassen om het gewenste kwaliteitsniveau te bereiken en tegelijkertijd de opslagruimte verkleinen. De beeldkwaliteit wordt verwaarloosbaar beïnvloed als 10:1 compressie op de afbeelding wordt toegepast. Hoe hoger de compressiewaarde, hoe groter de verslechtering van de beeldkwaliteit.

    Lees verder

    DOC Wat is DOC Bestandsformaat

    Bestanden met de extensie .doc vertegenwoordigen documenten die zijn gegenereerd door Microsoft Word of andere tekstverwerkingsdocumenten in binaire bestandsindeling. De extensie werd aanvankelijk gebruikt voor documentatie in platte tekst op verschillende besturingssystemen. Het kan verschillende soorten gegevens bevatten, zoals afbeeldingen, zowel opgemaakte als platte tekst, grafieken, diagrammen, ingesloten objecten, koppelingen, pagina's, pagina-opmaak, afdrukinstellingen en nog veel meer. Het formaat was populair voor allerlei soorten documentatie vanwege de verscheidenheid aan opties die het gebruikers biedt voor het schrijven van handleidingen, voorstellen, specificaties, cv's, artikelen of soortgelijke documenten. De bijgewerkte versie van DOC is DOCX die is gebaseerd op Office OpenXML waarvan de specificaties vrij beschikbaar zijn.

    Lees verder

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)