A szöveges keresés és a tartalomindexelés engedélyezése a különféle dokumentumfájl-formátumokhoz lehetővé teszi a felhasználók számára a termelékenység optimalizálását, az adatlekérdezés egyszerűsítését, valamint a szervezetek és alkalmazások közötti információkezelés javítását. Növelje .NET-alapú szoftverei vagy rendszerei funkcionalitását azáltal, hogy lehetővé teszi a dokumentumokon belüli szöveges keresést, és indexeket hoz létre az információk hatékony lekéréséhez a különböző dokumentumfájl-formátumokból.
A dokumentumokban való keresés legfontosabb okai
- Dokumentum szervezés
- Információszerzés
- Tartalom érvényesítése
- Tartalom összefoglalása
- Szövegelemzés
- Adatkinyerés
- Dokumentum indexelés
PDF dokumentumok keresése
A Aspose.PDF for .NET -et, a Aspose.Total for .NET gyermek API-ját használjuk, amelyet bizonyos dokumentumkezelési funkciókhoz, valamint a dokumentumtartalom lekéréséhez és kereséséhez kapcsolódó feladatokhoz terveztek. Az alábbi kódrészlet C#-ban van írva a PDF-dokumentumokkal való interakcióhoz. Először beállít egy reguláris kifejezés-mintát a nem szóköz karakterek sorozatának kereséséhez a dokumentumban. Ezután eléri a PDF első oldalát, és egy TextFragmentAbsorber segítségével keres szöveget az oldalon a megadott reguláris kifejezés használatával. A kód ezután egy gyűjteménybe gyűjti a felfedezett szövegrészleteket. Végül végigfut ezen a gyűjteményen, és minden azonosított szövegrészletet kiad a konzolba. Lényegében ez a kódrészlet arra szolgál, hogy meghatározott szövegmintákat vonjon ki és jelenítsen meg egy PDF-dokumentumból. Ezenkívül a .NET Search API támogatja a Microsoft Word dokumentum keresés -at és más formátumokat is.