HTML JPG OCR XML BMP
Aspose.OCR  per C++
DOCX

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato TIFF e crea documenti TIFF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Con C++ OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine TIFF in un documento DOCX:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.aposeocr_page()
  • Passa il percorso del file TIFF come parametro
  • AsposeOCR.asposeocr_page restituisce una stringa o un file di tipo DOCX

Requisiti di sistema

Prima di eseguire l’esempio, assicurati che Microsoft.ML.OnnxRuntime 1.7.0 o versione successiva sia aggiunto al progetto. Dovrebbe essere installato automaticamente se si installa Aspose.OCR tramite NuGet Package Manager.

  • Soluzione compatibile con NET Standard 2.0+
  • Aspose.OCR per .NET referenziato nel tuo progetto.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • TIFF Cos'è TIFF Formato del file

    TIFF o TIF, Tagged Image File Format, rappresenta immagini raster destinate all'uso su una varietà di dispositivi conformi a questo standard di formato file. È in grado di descrivere dati di immagini a due livelli, in scala di grigi, a colori ea colori in diversi spazi colore. Supporta schemi di compressione lossy e lossless per scegliere tra spazio e tempo per le applicazioni che utilizzano il formato. Il formato è estensibile e ha subito diverse revisioni che consentono l'inclusione di una quantità illimitata di informazioni private o per scopi speciali. Il formato non dipende dalla macchina ed è libero da limiti come processore, sistema operativo o file system.

    Leggi di più

    DOCX Cos'è DOCX Formato del file

    DOCX è un formato ben noto per i documenti di Microsoft Word. Introdotto dal 2007 con il rilascio di Microsoft Office 2007, la struttura di questo nuovo formato del documento è stata modificata da semplice binario a una combinazione di file XML e binari. I file Docx possono essere aperti con Word 2007 e versioni laterali ma non con le versioni precedenti di MS Word che supportano le estensioni di file DOC.

    Leggi di più

    TXT (File di documento di testo)
    Text (File di documento di testo)
    DOC (Documenti generati da Microsoft Word)
    DOCX (Documenti Microsoft Word)
    XLS (Formato file binario Microsoft Excel)
    XLSX (Documenti Microsoft Excel)
    PDF (Formato documento portatile (PDF))
    Searchable PDF (Grafica di rete portatile ricercabile)