HTML JPG OCR XML BMP
Aspose.OCR  per C++
DOC

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato PDF e crea documenti PDF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Con C++ OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine PDF in un documento DOC:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.aposeocr_page()
  • Passa il percorso del file PDF come parametro
  • AsposeOCR.asposeocr_page restituisce una stringa o un file di tipo DOC

Requisiti di sistema

Prima di eseguire l’esempio, assicurati che Microsoft.ML.OnnxRuntime 1.7.0 o versione successiva sia aggiunto al progetto. Dovrebbe essere installato automaticamente se si installa Aspose.OCR tramite NuGet Package Manager.

  • Soluzione compatibile con NET Standard 2.0+
  • Aspose.OCR per .NET referenziato nel tuo progetto.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • PDF Cos'è PDF Formato del file

    Portable Document Format (PDF) è un tipo di documento creato da Adobe negli anni '90. Lo scopo di questo formato di file era quello di introdurre uno standard per la rappresentazione di documenti e altro materiale di riferimento in un formato indipendente dal software applicativo, dall'hardware e dal sistema operativo. Il formato di file PDF ha la piena capacità di contenere informazioni come testo, immagini, collegamenti ipertestuali, campi modulo, rich media, firme digitali, allegati, metadati, caratteristiche geospaziali e oggetti 3D che possono diventare parte del documento di origine.

    Leggi di più

    DOC Cos'è DOC Formato del file

    I file con estensione .doc rappresentano documenti generati da Microsoft Word o altri documenti di elaborazione testi in formato binario. L'estensione è stata inizialmente utilizzata per la documentazione in testo normale su diversi sistemi operativi. Può contenere diversi tipi di dati come immagini, formattati e testo normale, grafici, grafici, oggetti incorporati, collegamenti, pagine, formattazione della pagina, impostazioni di stampa e molti altri. Il formato era popolare per tutti i tipi di documentazione grazie alla varietà di opzioni che offre agli utenti per la scrittura di manuali, proposte, specifiche, curriculum, articoli o documenti simili. La versione aggiornata di DOC è DOCX che si basa su Office OpenXML le cui specifiche sono pubblicamente disponibili.

    Leggi di più