Converti PDF in DOC in C#
Esegui il riconoscimento ottico dei caratteri sul documento PDF e salva il testo come documento PDF utilizzando Aspose.OCR dalla libreria .NET.
Come convertire PDF in DOC usando C#
Aspose.OCR per .NET è una libreria potente ma facile da usare ed economica per convertire immagini PDF in documenti DOC. Supportando 26 lingue basate su latino, cirillico e cinese, il suo motore di riconoscimento ottico dei caratteri all’avanguardia offre velocità e precisione di riconoscimento superiori, isolandoti da formule, reti neurali e altri dettagli tecnici complessi. Ti consente di aggiungere funzionalità OCR alle tue applicazioni .NET in meno di 10 righe di codice.
elabora le immagini scansionate o anche le foto dello smartphone in formato PDF e crea documenti PDF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo installare Aspose.OCR
pacchetto nel tuo progetto con il seguente comando:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Passaggi per convertire PDF in DOC
Con .NET OCR e poche righe di codice, puoi creare un’applicazione completa che converte un’immagine PDF in un documento DOC:
- Crea un’istanza della classe AsposeOcr
- Chiama il metodo AsposeOCR.RecognizeImage
- Passa il percorso del file PDF come parametro
- AsposeOCR.RecognizeImage restituisce una stringa o un file di tipo DOC
Requisiti di sistema
Prima di eseguire l’esempio, assicurati che l’API .NET compatibile con la specifica NET Standard 2.0 sia installata sul tuo sistema e tutte le [dipendenze esterne]( https://docs.aspose.com/ocr/net/system-requirements/#external- dipendenze) del pacchetto Aspose.OCR sono referenziati nel progetto.
- Soluzione compatibile con NET Standard 2.0+
- Aspose.OCR per .NET referenziato nel tuo progetto.
Questo codice di esempio mostra la conversione da PDF a DOC .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.DOC", riText);
PDF Cos'è PDF Formato del file
Portable Document Format (PDF) è un tipo di documento creato da Adobe negli anni '90. Lo scopo di questo formato di file era quello di introdurre uno standard per la rappresentazione di documenti e altro materiale di riferimento in un formato indipendente dal software applicativo, dall'hardware e dal sistema operativo. Il formato di file PDF ha la piena capacità di contenere informazioni come testo, immagini, collegamenti ipertestuali, campi modulo, rich media, firme digitali, allegati, metadati, caratteristiche geospaziali e oggetti 3D che possono diventare parte del documento di origine.
Leggi di piùDOC Cos'è DOC Formato del file
I file con estensione .doc rappresentano documenti generati da Microsoft Word o altri documenti di elaborazione testi in formato binario. L'estensione è stata inizialmente utilizzata per la documentazione in testo normale su diversi sistemi operativi. Può contenere diversi tipi di dati come immagini, formattati e testo normale, grafici, grafici, oggetti incorporati, collegamenti, pagine, formattazione della pagina, impostazioni di stampa e molti altri. Il formato era popolare per tutti i tipi di documentazione grazie alla varietà di opzioni che offre agli utenti per la scrittura di manuali, proposte, specifiche, curriculum, articoli o documenti simili. La versione aggiornata di DOC è DOCX che si basa su Office OpenXML le cui specifiche sono pubblicamente disponibili.
Leggi di piùAltre conversioni supportate
Usando C#, è possibile convertire facilmente diversi formati tra cui.