ค้นหาเอกสารโดยใช้ .NET API

ค้นหาและดึงข้อมูลจากเอกสารที่หลากหลายได้อย่างง่ายดาย ครอบคลุมไฟล์ Microsoft Office Word, Excel, PowerPoint และ PDF ในลักษณะที่มีประสิทธิภาพสูงด้วย Aspose.Total สำหรับ .NET

 

การเปิดใช้งานการค้นหาข้อความและการจัดทำดัชนีเนื้อหาสำหรับรูปแบบไฟล์เอกสารที่หลากหลายทำให้ผู้ใช้สามารถเพิ่มประสิทธิภาพการทำงาน ปรับปรุงการดึงข้อมูล และปรับปรุงการจัดการข้อมูลทั่วทั้งองค์กรและแอปพลิเคชัน ปรับปรุงฟังก์ชันการทำงานของซอฟต์แวร์หรือระบบที่ใช้ .NET ของคุณโดยเปิดใช้งานการค้นหาด้วยข้อความภายในเอกสารและสร้างดัชนีเพื่อการดึงข้อมูลจากรูปแบบไฟล์เอกสารที่หลากหลายอย่างมีประสิทธิภาพ

เหตุผลสำคัญในการค้นหาในเอกสาร

  1. การจัดระเบียบเอกสาร
  2. การสืบค้นข้อมูล
  3. การตรวจสอบเนื้อหา
  4. การสรุปเนื้อหา
  5. การวิเคราะห์ข้อความ
  6. การสกัดข้อมูล
  7. การจัดทำดัชนีเอกสาร

ค้นหาเอกสาร PDF

เราใช้ Aspose.PDF for .NET ซึ่งเป็น API ลูกของ Aspose.Total for .NET ที่ออกแบบมาสำหรับคุณสมบัติการจัดการเอกสารโดยเฉพาะ รวมถึงงานที่เกี่ยวข้องกับการดึงและค้นหาเนื้อหาเอกสาร ข้อมูลโค้ดด้านล่างเขียนด้วยภาษา C# เพื่อโต้ตอบกับเอกสาร PDF ขั้นแรกจะตั้งค่ารูปแบบนิพจน์ทั่วไปเพื่อค้นหาลำดับของอักขระที่ไม่ใช่ช่องว่างภายในเอกสาร จากนั้นจะเข้าถึงหน้าแรกของ PDF และใช้ TextFragmentAbsorber เพื่อค้นหาข้อความบนหน้านั้นโดยใช้นิพจน์ทั่วไปที่ระบุ จากนั้นโค้ดจะรวบรวมส่วนของข้อความที่ค้นพบไว้ในคอลเลกชัน สุดท้ายจะวนซ้ำผ่านคอลเลกชันนี้และส่งออกส่วนข้อความที่ระบุแต่ละส่วนไปยังคอนโซล โดยพื้นฐานแล้ว ข้อมูลโค้ดนี้ทำหน้าที่เป็นกลไกในการแยกและแสดงรูปแบบข้อความเฉพาะจากเอกสาร PDF นอกจากนี้ .NET Search API ยังรองรับ Microsoft ค้นหาเอกสารคำ และรูปแบบอื่นๆ อีกด้วย

รหัส C# สำหรับการค้นหาเอกสาร PDF