Przeszukuj dokumenty przy użyciu interfejsów API platformy .NET

Z łatwością wyszukuj i pobieraj dane z szerokiej gamy dokumentów, obejmujących pliki Microsoft Office Word, Excel, PowerPoint i PDF, w bardzo wydajny sposób dzięki Aspose.Total dla .NET.

 

Włączenie wyszukiwania tekstu i indeksowania treści dla różnych formatów plików dokumentów umożliwia użytkownikom optymalizację produktywności, usprawnienie wyszukiwania danych i usprawnienie zarządzania informacjami w organizacjach i aplikacjach. Zwiększ funkcjonalność oprogramowania lub systemów opartych na platformie .NET, umożliwiając wyszukiwanie tekstowe w dokumentach i ustanawiając indeksy w celu wydajnego wyszukiwania informacji z różnorodnej gamy formatów plików dokumentów.

Kluczowe powody, dla których warto przeszukiwać dokumenty

  1. Organizacja dokumentów
  2. Wyszukiwanie informacji
  3. Walidacja treści
  4. Podsumowanie treści
  5. Analiza tekstu
  6. Ekstrakcja danych
  7. Indeksowanie dokumentów

Wyszukaj dokumenty PDF

Używamy Aspose.PDF for .NET , podrzędnego API Aspose.Total for .NET zaprojektowanego do określonych funkcji manipulacji dokumentami, a także zadań związanych z wyszukiwaniem i wyszukiwaniem treści dokumentów. Poniższy fragment kodu napisano w języku C# w celu interakcji z dokumentem PDF. Najpierw konfiguruje wzorzec wyrażenia regularnego w celu wyszukiwania w dokumencie sekwencji znaków innych niż białe znaki. Następnie uzyskuje dostęp do pierwszej strony pliku PDF i wykorzystuje TextFragmentAbsorber do wyszukiwania tekstu na tej stronie przy użyciu określonego wyrażenia regularnego. Następnie kod gromadzi odkryte fragmenty tekstu w kolekcji. Na koniec iteruje po tej kolekcji i wysyła każdy zidentyfikowany fragment tekstu do konsoli. Zasadniczo ten fragment kodu służy jako mechanizm wyodrębniania i wyświetlania określonych wzorców tekstu z dokumentu PDF. Co więcej, .NET Search API obsługuje także Microsoft Wyszukiwanie dokumentów Worda i inne formaty.

Kod C# do wyszukiwania dokumentów PDF