Αναζήτηση εγγράφων χρησιμοποιώντας .NET API

Αναζητήστε και λάβετε εύκολα δεδομένα από ένα ευρύ φάσμα εγγράφων, που περιλαμβάνουν αρχεία Microsoft Office Word, Excel, PowerPoint και PDF με εξαιρετικά αποτελεσματικό τρόπο με το Aspose.Total για .NET.

 

Η ενεργοποίηση αναζήτησης κειμένου και ευρετηρίασης περιεχομένου για διάφορες μορφές αρχείων εγγράφων δίνει στους χρήστες τη δυνατότητα να βελτιστοποιούν την παραγωγικότητα, να βελτιστοποιούν την ανάκτηση δεδομένων και να βελτιώνουν τη διαχείριση πληροφοριών σε οργανισμούς και εφαρμογές. Βελτιώστε τη λειτουργικότητα του λογισμικού ή των συστημάτων σας που βασίζονται σε .NET επιτρέποντας αναζητήσεις βάσει κειμένου εντός εγγράφων και δημιουργώντας ευρετήρια για την αποτελεσματική ανάκτηση πληροφοριών από μια ποικιλία μορφών αρχείων εγγράφων.

Βασικοί λόγοι για αναζήτηση σε έγγραφα

  1. Οργάνωση Εγγράφων
  2. Ανάκτηση πληροφορίας
  3. Επικύρωση περιεχομένου
  4. Σύνοψη περιεχομένου
  5. Ανάλυση Κειμένου
  6. Εξαγωγή Δεδομένων
  7. Ευρετηρίαση εγγράφων

Αναζήτηση εγγράφων PDF

Χρησιμοποιούμε το Aspose.PDF for .NET , ένα θυγατρικό API του Aspose.Total for .NET που έχει σχεδιαστεί για συγκεκριμένες λειτουργίες χειρισμού εγγράφων, καθώς και για εργασίες που σχετίζονται με την ανάκτηση και την αναζήτηση περιεχομένου εγγράφων. Το παρακάτω απόσπασμα κώδικα είναι γραμμένο σε C# για αλληλεπίδραση με ένα έγγραφο PDF. Αρχικά δημιουργεί ένα μοτίβο κανονικής έκφρασης για την αναζήτηση ακολουθιών χαρακτήρων χωρίς κενά μέσα στο έγγραφο. Στη συνέχεια, αποκτά πρόσβαση στην πρώτη σελίδα του PDF και χρησιμοποιεί ένα TextFragmentAbsorber για αναζήτηση κειμένου σε αυτήν τη σελίδα χρησιμοποιώντας την καθορισμένη τυπική έκφραση. Στη συνέχεια, ο κώδικας συλλέγει τα κομμάτια κειμένου που ανακαλύφθηκαν σε μια συλλογή. Τέλος, επαναλαμβάνεται μέσω αυτής της συλλογής και εξάγει κάθε προσδιορισμένο τμήμα κειμένου στην κονσόλα. Ουσιαστικά, αυτό το απόσπασμα κώδικα χρησιμεύει ως μηχανισμός εξαγωγής και εμφάνισης συγκεκριμένων μοτίβων κειμένου από ένα έγγραφο PDF. Επιπλέον, το .NET Search API υποστηρίζει επίσης το Microsoft Αναζήτηση εγγράφων Word και άλλες μορφές.

Κωδικός C# για Αναζήτηση εγγράφων PDF