Cerca documenti utilizzando le API .NET

Cerca e recupera facilmente dati da un’ampia gamma di documenti, compresi file Microsoft Office Word, Excel, PowerPoint e PDF in modo estremamente efficiente con Aspose.Total per .NET.

 

L’abilitazione della ricerca di testo e dell’indicizzazione dei contenuti per diversi formati di file di documenti consente agli utenti di ottimizzare la produttività, semplificare il recupero dei dati e migliorare la gestione delle informazioni tra organizzazioni e applicazioni. Migliora la funzionalità del tuo software o dei tuoi sistemi basati su .NET abilitando ricerche basate su testo all’interno dei documenti e stabilendo indici per il recupero efficiente di informazioni da una vasta gamma di formati di file di documenti.

Motivi principali per effettuare ricerche nei documenti

  1. Organizzazione dei documenti
  2. Recupero delle informazioni
  3. Convalida dei contenuti
  4. Riepilogo dei contenuti
  5. Analisi del testo
  6. Estrazione dati
  7. Indicizzazione dei documenti

Cerca documenti PDF

Utilizziamo Aspose.PDF for .NET , un’API figlia di Aspose.Total for .NET progettata per particolari funzionalità di manipolazione dei documenti, nonché attività associate al recupero e alla ricerca del contenuto dei documenti. Lo snippet di codice seguente è scritto in C# per interagire con un documento PDF. Innanzitutto imposta un modello di espressione regolare per cercare sequenze di caratteri diversi dagli spazi bianchi all’interno del documento. Successivamente, accede alla prima pagina del PDF e utilizza TextFragmentAbsorber per cercare il testo su quella pagina utilizzando l’espressione regolare specificata. Il codice raccoglie quindi i frammenti di testo scoperti in una raccolta. Infine, scorre questa raccolta e restituisce alla console ogni frammento di testo identificato. In sostanza, questo frammento di codice funge da meccanismo per estrarre e visualizzare modelli di testo specifici da un documento PDF. Inoltre, l’API .NET Search supporta anche Microsoft Ricerca di documenti Word e altri formati.

Codice C# per la ricerca di documenti PDF