Mengaktifkan pencarian teks dan pengindeksan konten untuk beragam format file dokumen memberdayakan pengguna untuk mengoptimalkan produktivitas, menyederhanakan pengambilan data, dan meningkatkan manajemen informasi di seluruh organisasi dan aplikasi. Tingkatkan fungsionalitas perangkat lunak atau sistem berbasis .NET Anda dengan mengaktifkan pencarian berbasis teks dalam dokumen dan membuat indeks untuk pengambilan informasi yang efisien dari beragam format file dokumen.
Alasan Utama untuk Mencari di Dokumen
- Organisasi Dokumen
- Pengambilan Informasi
- Validasi Konten
- Peringkasan Konten
- Analisis Teks
- Ekstraksi Data
- Pengindeksan Dokumen
Cari Dokumen PDF
Kami menggunakan Aspose.PDF for .NET , API anak Aspose.Total for .NET yang dirancang untuk fitur manipulasi dokumen tertentu serta tugas yang terkait dengan pengambilan dan pencarian konten dokumen. Cuplikan kode di bawah ini ditulis dalam C# untuk berinteraksi dengan dokumen PDF. Ini pertama-tama menyiapkan pola ekspresi reguler untuk mencari urutan karakter non-spasi dalam dokumen. Selanjutnya, ia mengakses halaman pertama PDF dan menggunakan TextFragmentAbsorber untuk mencari teks pada halaman tersebut menggunakan ekspresi reguler yang ditentukan. Kode tersebut kemudian mengumpulkan fragmen teks yang ditemukan ke dalam sebuah koleksi. Terakhir, ia mengulangi koleksi ini dan mengeluarkan setiap fragmen teks yang teridentifikasi ke konsol. Pada dasarnya, cuplikan kode ini berfungsi sebagai mekanisme untuk mengekstrak dan menampilkan pola teks tertentu dari dokumen PDF. Selain itu, .NET Search API juga mendukung Microsoft Pencarian dokumen Word dan format lainnya.