Extraire des images d’un PDF en Java

Comment extraire des images d’un PDF à l’aide de la bibliothèque Java

Comment extraire des images d'un PDF à l'aide de la bibliothèque Java

Avez-vous besoin d’extraire des images d’un PDF ? La modification programmatique des documents PDF est un élément essentiel des flux de travail numériques modernes. Avec les bibliothèques Java telles que Aspose.PDF, les développeurs peuvent extraire des images d’un PDF. Ces bibliothèques sont des solutions autonomes qui ne s’appuient sur aucun autre logiciel et sont prêtes à être utilisées à des fins commerciales. Ils couvrent tous les besoins possibles des développeurs Java professionnels.

  • Extraire le texte d’un PDF
  • Extraire des images d’un PDF
  • Extraire les polices d’un PDF
  • Extraire les données du formulaire
  • Extraire le texte des timbres
  • Extraire les données du tableau

Pour extraire des images d’un fichier PDF, nous utiliserons l’API Aspose.PDF pour Java qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme Java. Vous pouvez télécharger sa dernière version directement depuis Maven et l’installer dans votre projet basé sur Maven en ajoutant les configurations suivantes au pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraire des images d’un PDF en Java


Vous avez besoin de Aspose.PDF pour Java pour essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet XImage pour extraire des images.
  3. Enregistrez l’image de sortie dans un fichier JPEG.
  4. Enregistrez le fichier PDF mis à jour.

Extraire des images d'un PDF - Java

Cet exemple de code montre comment extraire des images de documents PDF

Input file:

File not added

Output format:

PDF

Output file:

    public static void Extract_Images(){
       // The path to the documents directory.
       String _dataDir = "/home/admin1/pdf-examples/Samples/";
       String filePath = _dataDir + "ExtractImages.pdf";

       // Load PDF document
       com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(filePath);

       com.aspose.pdf.Page page = pdfDocument.getPages().get_Item(1);
       com.aspose.pdf.XImageCollection xImageCollection = page.getResources().getImages();
       // Extract a particular image
       com.aspose.pdf.XImage xImage = xImageCollection.get_Item(1);

       try {
           java.io.FileOutputStream outputImage = new java.io.FileOutputStream(_dataDir + "output.jpg");
           // Save output image
           xImage.save(outputImage);
           outputImage.close();
       } catch (java.io.FileNotFoundException e) {
           // TODO: handle exception
           e.printStackTrace();
       } catch (java.io.IOException e) {
           // TODO: handle exception
           e.printStackTrace();
       }
   }

À propos de Aspose.PDF pour l'API Java

L’API Aspose.PDF pour Java est une bibliothèque qui permet aux développeurs d’ajouter des fonctionnalités de traitement PDF à leurs applications. Il peut être utilisé pour créer tout type d’applications 32 bits et 64 bits afin de générer ou de lire, de convertir et de manipuler des fichiers PDF sans utiliser Adobe Acrobat. Aspose.PDF pour Java permet aux développeurs d’insérer des tableaux, des graphiques, des images, des hyperliens, des polices personnalisées, etc., dans des documents PDF. De plus, il est également possible de compresser des PDF. Aspose.PDF pour Java fournit d’excellentes fonctionnalités de sécurité pour développer des fichiers PDF sécurisés.

Vous pouvez trouver plus d’informations sur l’API Aspose.PDF pour Java sur documentation et exemples sur l’utilisation de l’API. Parmi les principales fonctionnalités de l’API Aspose.PDF pour Java, citons la prise en charge de divers formats de fichiers, notamment les formats de fichiers HTML, XFA, TXT, PCL, XML, XPS et image, la prise en charge de différentes versions PDF et de nombreuses fonctionnalités de liens hypertexte.