Habilitar la búsqueda de texto y la indexación de contenido para diversos formatos de archivos de documentos permite a los usuarios optimizar la productividad, agilizar la recuperación de datos y mejorar la gestión de la información en todas las organizaciones y aplicaciones. Mejore la funcionalidad de su software o sistemas basados en .NET permitiendo búsquedas basadas en texto dentro de documentos y estableciendo índices para la recuperación eficiente de información de una amplia gama de formatos de archivos de documentos.
Razones clave para buscar en documentos
- Organización del documento
- Recuperación de información
- Validación de contenido
- Resumen de contenido
- Análisis de texto
- Extracción de datos
- Indexación de documentos
Buscar documentos PDF
Usamos Aspose.PDF for .NET , una API secundaria de Aspose.Total for .NET diseñada para funciones particulares de manipulación de documentos, así como para tareas asociadas con la recuperación y búsqueda de contenido de documentos. El siguiente fragmento de código está escrito en C# para interactuar con un documento PDF. Primero configura un patrón de expresión regular para buscar secuencias de caracteres que no sean espacios en blanco dentro del documento. A continuación, accede a la primera página del PDF y emplea un TextFragmentAbsorber para buscar texto en esa página utilizando la expresión regular especificada. Luego, el código recopila los fragmentos de texto descubiertos en una colección. Finalmente, recorre esta colección y envía cada fragmento de texto identificado a la consola. Básicamente, este fragmento de código sirve como mecanismo para extraer y mostrar patrones de texto específicos de un documento PDF. Además, .NET Search API también es compatible con Microsoft búsqueda de documentos de word y otros formatos.