Wyszukaj pliki PDF za pomocą języka C#

Wysokowydajne wyszukiwanie dokumentów PDF przy użyciu pliku Aspose.PDF po stronie serwera dla interfejsów API .NET

Jak wyszukiwać PDF za pomocą C#

Aby wyszukać plik PDF, użyjemy interfejsu API Aspose.PDF, który jest bogatym w funkcje, wydajnym i łatwym w użyciu interfejsem API do manipulacji dokumentami. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.PDF i zainstaluj. Można również użyć następującego polecenia z konsoli Menedżera pakietów. Podpisując dokument PDF za pomocą podpisu, zasadniczo potwierdzasz jego zawartość „tak, jak jest”. W związku z tym wszelkie inne zmiany wprowadzone później unieważniają podpis, a tym samym, wiesz, czy dokument został zmieniony.

Przeszukuj dokument PDF bez otwierania za pomocą .NET:

  1. Tworzenie obiektu TextFragmentAbsorber z tekstem, aby znaleźć jako parametr.
  2. Pobierz całą kolekcję wyodrębnionych fragmentów tekstu.
  3. Pętla przez każdy fragment, aby uzyskać wszystkie jego informacje.

Wyszukaj plik PDF

Ten przykładowy kod pokazuje, jak wyszukiwać plik PDF za pomocĄ.NET

    //Search Text from All the Pages of PDF Document
    Document pdfDocument = new Document("SearchAndGetTextFromAll.pdf");

    // Create TextAbsorber object to find all instances of the input search phrase
    TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("text");

    // Accept the absorber for all the pages
    pdfDocument.Pages.Accept(textFragmentAbsorber);

    // Get the extracted text fragments
    TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;

    // Loop through the fragments
    foreach (TextFragment textFragment in textFragmentCollection)
    {

        Console.WriteLine("Text : {0} ", textFragment.Text);
        Console.WriteLine("Position : {0} ", textFragment.Position);
        Console.WriteLine("XIndent : {0} ", textFragment.Position.XIndent);
        Console.WriteLine("YIndent : {0} ", textFragment.Position.YIndent);
        Console.WriteLine("Font - Name : {0}", textFragment.TextState.Font.FontName);
        Console.WriteLine("Font - IsAccessible : {0} ", textFragment.TextState.Font.IsAccessible);
        Console.WriteLine("Font - IsEmbedded : {0} ", textFragment.TextState.Font.IsEmbedded);
        Console.WriteLine("Font - IsSubset : {0} ", textFragment.TextState.Font.IsSubset);
        Console.WriteLine("Font Size : {0} ", textFragment.TextState.FontSize);
        Console.WriteLine("Foreground Color : {0} ", textFragment.TextState.ForegroundColor);
    }