HTML JPG OCR XML BMP
Aspose.OCR  voor C++
Searchable PDF

Aspose.Imaging voor Java

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in TIFF-indeling en maakt TIFF-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.

Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Met C++ OCR en slechts een paar regels code, kun je een complete applicatie maken die een TIFF afbeelding converteert naar een Searchable PDF document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep de methode AsposeOCR.asposeocr_page() aan
  • Geef het TIFF bestandspad door als parameter
  • AsposeOCR.asposeocr_page retourneert een String of bestand van het type Searchable PDF

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Microsoft.ML.OnnxRuntime 1.7.0 of hoger aan het project is toegevoegd. Het zou automatisch moeten worden geïnstalleerd als u Aspose.OCR installeert via NuGet Package Manager.

  • NET Standard 2.0+ compatibele oplossing
  • Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • TIFF Wat is TIFF Bestandsformaat

    TIFF of TIF, Tagged Image File Format, staat voor rasterafbeeldingen die bedoeld zijn voor gebruik op verschillende apparaten die voldoen aan deze standaard voor bestandsindelingen. Het is in staat om bilevel-, grijswaarden-, paletkleur- en full-color afbeeldingsgegevens in verschillende kleurruimten te beschrijven. Het ondersteunt zowel lossy als lossless compressieschema's om te kiezen tussen ruimte en tijd voor toepassingen die het formaat gebruiken. Het formaat is uitbreidbaar en heeft verschillende revisies ondergaan waardoor een onbeperkte hoeveelheid persoonlijke of speciale informatie kan worden opgenomen. Het formaat is niet machine-afhankelijk en is vrij van beperkingen zoals processor, besturingssysteem of bestandssystemen.

    Lees verder

    Searchable PDF Wat is Searchable PDF Bestandsformaat

    Doorzoekbare PDF-bestanden behouden de originele gescande afbeelding voor weergave, evenals OCR-tekst in een verborgen laag die kan worden gebruikt voor zoekopdrachten in volledige tekst in een document of om tekst te markeren voor kopieer- en plakbewerkingen. Volledige OCR-conversie naar PDF, exclusief de originele afbeelding, zal nooit 100% van de originele opmaak behouden, vooral als het document veel afbeeldingen of een complexe lay-out heeft.

    Lees verder

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)