elabora le immagini scansionate o anche le foto dello smartphone in formato DJVU e crea documenti DJVU contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR
Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Con C++ OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine DJVU in un documento DOC:
- Crea un’istanza della classe AsposeOcr
- Chiama il metodo AsposeOCR.aposeocr_page()
- Passa il percorso del file DJVU come parametro
- AsposeOCR.asposeocr_page restituisce una stringa o un file di tipo DOC
Requisiti di sistema
Prima di eseguire l’esempio, assicurati che Microsoft.ML.OnnxRuntime 1.7.0 o versione successiva sia aggiunto al progetto. Dovrebbe essere installato automaticamente se si installa Aspose.OCR tramite NuGet Package Manager.
- Soluzione compatibile con NET Standard 2.0+
- Aspose.OCR per .NET referenziato nel tuo progetto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
DJVU Cos'è DJVU Formato del file
DjVu, pronunciato come "déjà vu", è un formato di file grafico destinato a documenti e libri scansionati, in particolare quelli che contengono la combinazione di testo, disegni, immagini e fotografie. È stato sviluppato da AT&T Labs. Utilizza più tecniche come la separazione del livello dell'immagine del testo e delle immagini di sfondo, il caricamento progressivo, la codifica aritmetica e la compressione con perdita di dati per le immagini bitonali. Poiché il file DJVU può contenere immagini a colori, fotografie, testo e disegni compressi ma di alta qualità e può essere salvato in meno spazio, quindi viene utilizzato sul Web come eBook, manuali, giornali, documenti antichi, ecc.
Leggi di piùDOC Cos'è DOC Formato del file
I file con estensione .doc rappresentano documenti generati da Microsoft Word o altri documenti di elaborazione testi in formato binario. L'estensione è stata inizialmente utilizzata per la documentazione in testo normale su diversi sistemi operativi. Può contenere diversi tipi di dati come immagini, formattati e testo normale, grafici, grafici, oggetti incorporati, collegamenti, pagine, formattazione della pagina, impostazioni di stampa e molti altri. Il formato era popolare per tutti i tipi di documentazione grazie alla varietà di opzioni che offre agli utenti per la scrittura di manuali, proposte, specifiche, curriculum, articoli o documenti simili. La versione aggiornata di DOC è DOCX che si basa su Office OpenXML le cui specifiche sono pubblicamente disponibili.
Leggi di più