elabora le immagini scansionate o anche le foto dello smartphone in formato PDF e crea documenti PDF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR
Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Con C++ OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine PDF in un documento DOCX:
- Crea un’istanza della classe AsposeOcr
- Chiama il metodo AsposeOCR.aposeocr_page()
- Passa il percorso del file PDF come parametro
- AsposeOCR.asposeocr_page restituisce una stringa o un file di tipo DOCX
Requisiti di sistema
Prima di eseguire l’esempio, assicurati che Microsoft.ML.OnnxRuntime 1.7.0 o versione successiva sia aggiunto al progetto. Dovrebbe essere installato automaticamente se si installa Aspose.OCR tramite NuGet Package Manager.
- Soluzione compatibile con NET Standard 2.0+
- Aspose.OCR per .NET referenziato nel tuo progetto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
PDF Cos'è PDF Formato del file
Portable Document Format (PDF) è un tipo di documento creato da Adobe negli anni '90. Lo scopo di questo formato di file era quello di introdurre uno standard per la rappresentazione di documenti e altro materiale di riferimento in un formato indipendente dal software applicativo, dall'hardware e dal sistema operativo. Il formato di file PDF ha la piena capacità di contenere informazioni come testo, immagini, collegamenti ipertestuali, campi modulo, rich media, firme digitali, allegati, metadati, caratteristiche geospaziali e oggetti 3D che possono diventare parte del documento di origine.
Leggi di piùDOCX Cos'è DOCX Formato del file
DOCX è un formato ben noto per i documenti di Microsoft Word. Introdotto dal 2007 con il rilascio di Microsoft Office 2007, la struttura di questo nuovo formato del documento è stata modificata da semplice binario a una combinazione di file XML e binari. I file Docx possono essere aperti con Word 2007 e versioni laterali ma non con le versioni precedenti di MS Word che supportano le estensioni di file DOC.
Leggi di più