Pesquisar documentos usando APIs .NET

Pesquise e busque facilmente dados de uma ampla variedade de documentos, abrangendo arquivos do Microsoft Office Word, Excel, PowerPoint e PDF de maneira altamente eficiente com Aspose.Total para .NET.

 

A habilitação da pesquisa de texto e da indexação de conteúdo para diversos formatos de arquivos de documentos permite que os usuários otimizem a produtividade, simplifiquem a recuperação de dados e aprimorem o gerenciamento de informações em organizações e aplicativos. Aprimore a funcionalidade de seu software ou sistemas baseados em .NET, permitindo pesquisas baseadas em texto em documentos e estabelecendo índices para a recuperação eficiente de informações de uma ampla variedade de formatos de arquivos de documentos.

Principais motivos para pesquisar em documentos

  1. Organização de Documentos
  2. Recuperação de informação
  3. Validação de conteúdo
  4. Resumo de conteúdo
  5. Análise de Texto
  6. Extração de dados
  7. Indexação de documentos

Pesquisar documentos PDF

Usamos Aspose.PDF for .NET , uma API filha do Aspose.Total for .NET projetada para recursos específicos de manipulação de documentos, bem como tarefas associadas à recuperação e pesquisa de conteúdo de documentos. O trecho de código abaixo está escrito em C# para interagir com um documento PDF. Primeiro, ele configura um padrão de expressão regular para procurar sequências de caracteres que não sejam espaços em branco no documento. Em seguida, ele acessa a primeira página do PDF e emprega um TextFragmentAbsorber para pesquisar texto nessa página usando a expressão regular especificada. O código então coleta os fragmentos de texto descobertos em uma coleção. Finalmente, ele percorre essa coleção e envia cada fragmento de texto identificado para o console. Essencialmente, este trecho de código serve como um mecanismo para extrair e exibir padrões de texto específicos de um documento PDF. Além disso, a API .NET Search também oferece suporte a Microsoft Pesquisa de documento do Word e outros formatos.

Código C# para pesquisa de documentos PDF