Zoek documenten met behulp van .NET API’s

Zoek en haal eenvoudig gegevens op uit een breed scala aan documenten, waaronder Microsoft Office Word-, Excel-, PowerPoint- en PDF-bestanden, op een zeer efficiënte manier met Aspose.Total voor .NET.

 

Door tekstzoekopdrachten en inhoudindexering voor diverse documentbestandsformaten mogelijk te maken, kunnen gebruikers de productiviteit optimaliseren, het ophalen van gegevens stroomlijnen en het informatiebeheer binnen organisaties en applicaties verbeteren. Verbeter de functionaliteit van uw op .NET gebaseerde software of systemen door op tekst gebaseerde zoekopdrachten in documenten mogelijk te maken en indexen op te zetten voor het efficiënt ophalen van informatie uit een breed scala aan documentbestandsformaten.

Belangrijkste redenen om in documenten te zoeken

  1. Documentorganisatie
  2. Informatie ophalen
  3. Validatie van inhoud
  4. Samenvatting van de inhoud
  5. Tekstanalyse
  6. Data-extractie
  7. Documentindexering

Zoek PDF-documenten

We gebruiken Aspose.PDF for .NET , een onderliggende API van Aspose.Total for .NET die is ontworpen voor specifieke functies voor documentmanipulatie en voor taken die verband houden met het ophalen en doorzoeken van documentinhoud. Het onderstaande codefragment is geschreven in C# voor interactie met een PDF-document. Het stelt eerst een reguliere-expressiepatroon in om te zoeken naar reeksen niet-witruimtetekens in het document. Vervolgens wordt de eerste pagina van de PDF geopend en wordt een TextFragmentAbsorber gebruikt om naar tekst op die pagina te zoeken met behulp van de opgegeven reguliere expressie. De code verzamelt vervolgens de ontdekte tekstfragmenten in een verzameling. Ten slotte doorloopt het deze verzameling en voert elk geïdentificeerd tekstfragment uit naar de console. In wezen dient dit codefragment als een mechanisme om specifieke tekstpatronen uit een PDF-document te extraheren en weer te geven. Bovendien ondersteunt de .NET Search API ook Microsoft Word-document zoeken en andere formaten.

C#-code voor het zoeken naar PDF-documenten