HTML JPG OCR XML BMP
Aspose.OCR  per .NET
Searchable PDF

Converti DJVU in Searchable PDF in C#

Esegui il riconoscimento ottico dei caratteri sul documento DJVU e salva il testo come documento DJVU utilizzando Aspose.OCR dalla libreria .NET.

Come convertire DJVU in Searchable PDF usando C#

Aspose.OCR per .NET è una libreria potente ma facile da usare ed economica per convertire immagini DJVU in documenti Searchable PDF. Supportando 26 lingue basate su latino, cirillico e cinese, il suo motore di riconoscimento ottico dei caratteri all’avanguardia offre velocità e precisione di riconoscimento superiori, isolandoti da formule, reti neurali e altri dettagli tecnici complessi. Ti consente di aggiungere funzionalità OCR alle tue applicazioni .NET in meno di 10 righe di codice.

Aspose.OCR per .NET

elabora le immagini scansionate o anche le foto dello smartphone in formato DJVU e crea documenti DJVU contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo installare Aspose.OCR

NuGet

pacchetto nel tuo progetto con il seguente comando:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Passaggi per convertire DJVU in Searchable PDF

Con .NET OCR e poche righe di codice, puoi creare un’applicazione completa che converte un’immagine DJVU in un documento Searchable PDF:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizeImage
  • Passa il percorso del file DJVU come parametro
  • AsposeOCR.RecognizeImage restituisce una stringa o un file di tipo Searchable PDF

Requisiti di sistema

Prima di eseguire l’esempio, assicurati che l’API .NET compatibile con la specifica NET Standard 2.0 sia installata sul tuo sistema e tutte le [dipendenze esterne]( https://docs.aspose.com/ocr/net/system-requirements/#external- dipendenze) del pacchetto Aspose.OCR sono referenziati nel progetto.

  • Soluzione compatibile con NET Standard 2.0+
  • Aspose.OCR per .NET referenziato nel tuo progetto.

Questo codice di esempio mostra la conversione da DJVU a Searchable PDF .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
  • DJVU Cos'è DJVU Formato del file

    DjVu, pronunciato come "déjà vu", è un formato di file grafico destinato a documenti e libri scansionati, in particolare quelli che contengono la combinazione di testo, disegni, immagini e fotografie. È stato sviluppato da AT&T Labs. Utilizza più tecniche come la separazione del livello dell'immagine del testo e delle immagini di sfondo, il caricamento progressivo, la codifica aritmetica e la compressione con perdita di dati per le immagini bitonali. Poiché il file DJVU può contenere immagini a colori, fotografie, testo e disegni compressi ma di alta qualità e può essere salvato in meno spazio, quindi viene utilizzato sul Web come eBook, manuali, giornali, documenti antichi, ecc.

    Leggi di più

    Searchable PDF Cos'è Searchable PDF Formato del file

    I file PDF ricercabili conservano l'immagine scansionata originale per la visualizzazione, nonché il testo OCR in un livello nascosto che può essere utilizzato per ricerche full-text all'interno di un documento o per evidenziare il testo per operazioni di copia e incolla. La conversione OCR completa in PDF, esclusa l'immagine originale, non manterrà mai il 100% della formattazione originale, soprattutto se il documento ha molte immagini o un layout complesso.

    Leggi di più

    Altre conversioni supportate

    Usando C#, è possibile convertire facilmente diversi formati tra cui.

    TXT (File di documento di testo)
    Text (File di documento di testo)
    DOC (Documenti generati da Microsoft Word)
    DOCX (Documenti Microsoft Word)
    XLS (Formato file binario Microsoft Excel)
    XLSX (Documenti Microsoft Excel)
    PDF (Formato documento portatile (PDF))
    Searchable PDF (Grafica di rete portatile ricercabile)
    XML (Linguaggio di markup estensibile)
    JSON (Notazione oggetto JavaScript)