さまざまなドキュメント ファイル形式のテキスト検索とコンテンツ インデックス作成を有効にすることで、ユーザーは生産性を最適化し、データ検索を合理化し、組織やアプリケーション全体での情報管理を強化できるようになります。 ドキュメント内のテキストベースの検索を有効にし、さまざまなドキュメント ファイル形式から情報を効率的に取得するためのインデックスを確立することにより、.NET ベースのソフトウェアまたはシステムの機能を強化します。
ドキュメント内を検索する主な理由
- 文書の構成
- 情報検索
- コンテンツの検証
- 内容の要約
- テキスト分析
- データ抽出
- ドキュメントのインデックス作成
PDF ドキュメントの検索
Aspose.PDF for .NET は、特定のドキュメント操作機能およびドキュメント コンテンツの取得と検索に関連するタスク用に設計された Aspose.Total for .NET の子 API です。 以下のコード スニペットは、PDF ドキュメントを操作するために C# で記述されています。 まず、ドキュメント内の非空白文字のシーケンスを検索するための正規表現パターンを設定します。 次に、PDF の最初のページにアクセスし、TextFragmentAbsorber を使用して、指定された正規表現を使用してそのページ上のテキストを検索します。 次に、コードは検出されたテキストの断片をコレクションに収集します。 最後に、このコレクションを反復処理し、識別された各テキスト断片をコンソールに出力します。基本的に、このコード スニペットは、PDF ドキュメントから特定のテキスト パターンを抽出して表示するメカニズムとして機能します。 さらに、.NET Search API は Microsoft Word文書検索 やその他の形式もサポートしています。