Keresés a dokumentumokban .NET API-k használatával

Az Aspose.Total for .NET segítségével könnyedén kereshet és tölthet le adatokat dokumentumok széles skálájából, beleértve a Microsoft Office Word-, Excel-, PowerPoint- és PDF-fájlokat is, rendkívül hatékony módon.

 

A szöveges keresés és a tartalomindexelés engedélyezése a különféle dokumentumfájl-formátumokhoz lehetővé teszi a felhasználók számára a termelékenység optimalizálását, az adatlekérdezés egyszerűsítését, valamint a szervezetek és alkalmazások közötti információkezelés javítását. Növelje .NET-alapú szoftverei vagy rendszerei funkcionalitását azáltal, hogy lehetővé teszi a dokumentumokon belüli szöveges keresést, és indexeket hoz létre az információk hatékony lekéréséhez a különböző dokumentumfájl-formátumokból.

A dokumentumokban való keresés legfontosabb okai

  1. Dokumentum szervezés
  2. Információszerzés
  3. Tartalom érvényesítése
  4. Tartalom összefoglalása
  5. Szövegelemzés
  6. Adatkinyerés
  7. Dokumentum indexelés

PDF dokumentumok keresése

A Aspose.PDF for .NET -et, a Aspose.Total for .NET gyermek API-ját használjuk, amelyet bizonyos dokumentumkezelési funkciókhoz, valamint a dokumentumtartalom lekéréséhez és kereséséhez kapcsolódó feladatokhoz terveztek. Az alábbi kódrészlet C#-ban van írva a PDF-dokumentumokkal való interakcióhoz. Először beállít egy reguláris kifejezés-mintát a nem szóköz karakterek sorozatának kereséséhez a dokumentumban. Ezután eléri a PDF első oldalát, és egy TextFragmentAbsorber segítségével keres szöveget az oldalon a megadott reguláris kifejezés használatával. A kód ezután egy gyűjteménybe gyűjti a felfedezett szövegrészleteket. Végül végigfut ezen a gyűjteményen, és minden azonosított szövegrészletet kiad a konzolba. Lényegében ez a kódrészlet arra szolgál, hogy meghatározott szövegmintákat vonjon ki és jelenítsen meg egy PDF-dokumentumból. Ezenkívül a .NET Search API támogatja a Microsoft Word dokumentum keresés -at és más formátumokat is.

C# kód a PDF dokumentumkereséshez