.NET API를 사용하여 문서 검색

Aspose.Total for .NET을 사용하면 Microsoft Office Word, Excel, PowerPoint 및 PDF 파일을 포함한 광범위한 문서에서 매우 효율적인 방식으로 데이터를 쉽게 검색하고 가져올 수 있습니다.

 

다양한 문서 파일 형식에 대한 텍스트 검색 및 콘텐츠 인덱싱을 활성화하면 사용자는 생산성을 최적화하고 데이터 검색을 간소화하며 조직과 애플리케이션 전반에 걸쳐 정보 관리를 강화할 수 있습니다. 문서 내에서 텍스트 기반 검색을 활성화하고 다양한 문서 파일 형식에서 정보를 효율적으로 검색하기 위한 색인을 설정하여 .NET 기반 소프트웨어 또는 시스템의 기능을 향상시킵니다.

문서에서 검색해야 하는 주요 이유

  1. 문서 구성
  2. 정보 검색
  3. 콘텐츠 검증
  4. 내용 요약
  5. 텍스트 분석
  6. 데이터 추출
  7. 문서 인덱싱

PDF 문서 검색

우리는 특정 문서 조작 기능은 물론 문서 콘텐츠 검색 및 검색과 관련된 작업을 위해 설계된 Aspose.Total for .NET 의 하위 API인 Aspose.PDF for .NET 을 사용합니다. 아래 코드 조각은 PDF 문서와 상호 작용하기 위해 C#으로 작성되었습니다. 먼저 문서 내에서 공백이 아닌 문자의 시퀀스를 검색하기 위해 정규식 패턴을 설정합니다. 다음으로 PDF의 첫 번째 페이지에 액세스하고 TextFragmentAbsorber를 사용하여 지정된 정규식을 사용하여 해당 페이지에서 텍스트를 검색합니다. 그런 다음 코드는 발견된 텍스트 조각을 컬렉션으로 수집합니다. 마지막으로 이 컬렉션을 반복하고 식별된 각 텍스트 조각을 콘솔에 출력합니다. 기본적으로 이 코드 조각은 PDF 문서에서 특정 텍스트 패턴을 추출하고 표시하는 메커니즘 역할을 합니다. 또한 .NET 검색 API는 Microsoft Word 문서 검색 및 기타 형식도 지원합니다.

PDF 문서 검색을 위한 C# 코드