Rechercher un PDF via Python

Recherche avancée de documents PDF. Utilisez Aspose.PDF pour Python for .NET afin de modifier des documents PDF par programmation

Comment rechercher un fichier PDF à l'aide de Python

Pour rechercher un fichier PDF, nous utiliserons Aspose.PDF for Python via .NET, une API puissante et simple d’utilisation. Ouvrez PyPI, installez-le et recherchez aspose-pdf. Vous pouvez également exécuter la commande suivante :

Console

pip install aspose-pdf

Rechercher un fichier PDF via Python


Vous devez Aspose.PDF for Python via .NET essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet TextFragmentAbsorber avec du texte à rechercher comme paramètre.
  3. Obtenez la collection de tous les fragments de texte extraits.
  4. Parcourez chaque fragment pour obtenir toutes ses informations.

Rechercher des fichiers PDF - Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)

document = apdf.Document(path_infile)

# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = apdf.text.TextFragmentAbsorber("PDF")

# Accept the absorber for all the pages
document.pages.accept(textFragmentAbsorber)

# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
    print(f"Text : {textFragment.text}" )
    print(f"Position : {textFragment.position}")
    print(f"XIndent : {textFragment.position.x_indent}")
    print(f"YIndent : {textFragment.position.y_indent}")
    print(f"Font - Name : {textFragment.text_state.font.font_name}" )
    print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
    print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
    print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
    print(f"Font Size : {textFragment.text_state.font_size}" )
    print(f"Foreground Color : {textFragment.text_state.foreground_color} " )