HTML JPG OCR XML BMP
Aspose.OCR  per .NET
XLS

Converti PDF in XLS in C#

Esegui il riconoscimento ottico dei caratteri sul documento PDF e salva il testo come documento PDF utilizzando Aspose.OCR dalla libreria .NET.

Come convertire PDF in XLS usando C#

Aspose.OCR per .NET è una libreria potente ma facile da usare ed economica per convertire immagini PDF in documenti XLS. Supportando 26 lingue basate su latino, cirillico e cinese, il suo motore di riconoscimento ottico dei caratteri all’avanguardia offre velocità e precisione di riconoscimento superiori, isolandoti da formule, reti neurali e altri dettagli tecnici complessi. Ti consente di aggiungere funzionalità OCR alle tue applicazioni .NET in meno di 10 righe di codice.

Aspose.OCR per .NET

elabora le immagini scansionate o anche le foto dello smartphone in formato PDF e crea documenti PDF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo installare Aspose.OCR

NuGet

pacchetto nel tuo progetto con il seguente comando:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Passaggi per convertire PDF in XLS

Con .NET OCR e poche righe di codice, puoi creare un’applicazione completa che converte un’immagine PDF in un documento XLS:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizeImage
  • Passa il percorso del file PDF come parametro
  • AsposeOCR.RecognizeImage restituisce una stringa o un file di tipo XLS

Requisiti di sistema

Prima di eseguire l’esempio, assicurati che l’API .NET compatibile con la specifica NET Standard 2.0 sia installata sul tuo sistema e tutte le [dipendenze esterne]( https://docs.aspose.com/ocr/net/system-requirements/#external- dipendenze) del pacchetto Aspose.OCR sono referenziati nel progetto.

  • Soluzione compatibile con NET Standard 2.0+
  • Aspose.OCR per .NET referenziato nel tuo progetto.

Questo codice di esempio mostra la conversione da PDF a XLS .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.XLS", riText);
  • PDF Cos'è PDF Formato del file

    Portable Document Format (PDF) è un tipo di documento creato da Adobe negli anni '90. Lo scopo di questo formato di file era quello di introdurre uno standard per la rappresentazione di documenti e altro materiale di riferimento in un formato indipendente dal software applicativo, dall'hardware e dal sistema operativo. Il formato di file PDF ha la piena capacità di contenere informazioni come testo, immagini, collegamenti ipertestuali, campi modulo, rich media, firme digitali, allegati, metadati, caratteristiche geospaziali e oggetti 3D che possono diventare parte del documento di origine.

    Leggi di più

    XLS Cos'è XLS Formato del file

    I file con estensione XLS rappresentano il formato file binario di Excel. Tali file possono essere creati da Microsoft Excel e da altri programmi di fogli di calcolo simili come OpenOffice Calc o Apple Numbers. Il file salvato da Excel è noto come cartella di lavoro in cui ogni cartella di lavoro può avere uno o più fogli di lavoro. I dati vengono archiviati e visualizzati agli utenti in formato tabella nel foglio di lavoro e possono comprendere valori numerici, dati di testo, formule, connessioni dati esterne, immagini e grafici. Applicazioni come Microsoft Excel ti consentono di esportare i dati della cartella di lavoro in diversi formati tra cui PDF, CSV, XLSX, TXT, HTML, XPS e molti altri. Il formato di file XLS è stato sostituito con un formato più aperto e strutturato, XLSX, con il rilascio di Microsoft Excel 2007. Le ultime versioni forniscono ancora supporto per la creazione e la lettura di file XLS, sebbene XLSX sia la prima scelta di utilizzo ora.

    Leggi di più

    Altre conversioni supportate

    Usando C#, è possibile convertire facilmente diversi formati tra cui.

    TXT (File di documento di testo)
    Text (File di documento di testo)
    DOC (Documenti generati da Microsoft Word)
    DOCX (Documenti Microsoft Word)
    XLS (Formato file binario Microsoft Excel)
    XLSX (Documenti Microsoft Excel)
    PDF (Formato documento portatile (PDF))
    Searchable PDF (Grafica di rete portatile ricercabile)
    XML (Linguaggio di markup estensibile)
    JSON (Notazione oggetto JavaScript)