Extraire le PDF via PHP

Comment extraire du texte et des images d’un PDF à l’aide de la bibliothèque PHP via Java

Action la plus populaire avec Parser

Comment analyser un PDF avec la bibliothèque PHP via Java

Pour extraire des fichiers PDF, nous utiliserons l’API Aspose.PDF pour .NET, qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plateforme php-java. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez-le. Vous pouvez également utiliser la commande suivante depuis la console Package Manager.

Analyser le PDF via PHP


Vous avez besoin de la bibliothèque Aspose.PDF pour essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet TextAbsorber pour extraire du texte.
  3. Acceptez l’absorbeur pour toutes les pages.
  4. Obtenir le texte extrait
  5. Créez un rédacteur et ouvrez le fichier, écrivez une ligne de texte dans le fichier

Extraire des fichiers PDF - PHP

Cet exemple de code montre comment extraire des documents PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

À propos de Aspose.PDF pour l'API Aspose.PDF for PHP via Java

Notre bibliothèque .NET peut combiner un document de n’importe quel format de téléchargement pris en charge vers n’importe quel format de sauvegarde pris en charge. La bibliothèque Aspose.PDF pour .NET fournit des solutions assez universelles qui vous aideront à résoudre les tâches de fusion de documents. Aspose.PDF prend en charge le plus grand nombre de formats de documents courants, tant pour le chargement que pour l’enregistrement. Attirez votre attention sur le fait que la section actuelle ne décrit que les fusions populaires. La page actuelle fournit des informations sur la fusion de {{FILETYPE}} avec {{FILERESULT}}. Cependant, il existe de nombreuses combinaisons pour fusionner vos fichiers. Pour une liste complète des formats pris en charge, consultez la section Formats de fichier pris en charge.