Estrai immagini da PDF in Python

Come estrarre immagini da PDF utilizzando la libreria Python for .NET

Come estrarre immagini da PDF utilizzando la libreria Python for .NET

Devi estrarre immagini da un PDF? La modifica programmatica dei documenti PDF è una parte essenziale dei moderni flussi di lavoro digitali. Con le librerie Python come Aspose.PDF, gli sviluppatori possono estrarre immagini da PDF. Queste librerie sono soluzioni autonome che non si basano su altri software e sono pronte per l’uso commerciale. Coprono tutte le possibili esigenze degli sviluppatori Python professionisti.

  • Estrai testo da PDF
  • Estrai immagini da PDF
  • Estrai caratteri da PDF
  • Estrai dati dal modulo
  • Estrai testo dai timbri
  • Estrai dati dalla tabella

Per estrarre immagini dal file PDF, utilizzeremo l’API Aspose.PDF per .NET che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Apri il gestore di pacchetti NuGet, cerca Aspose.pdf e installa. Puoi anche usare il seguente comando dalla console di Package Manager.

Python Package Manager Console

pip install aspose-pdf

Estrai immagini da PDF in Python


Per provare il codice nel tuo ambiente, hai bisogno di Aspose.PDF per Python.

  1. Carica il PDF con un’istanza di Document.
  2. Crea un oggetto XImage per estrarre le immagini.
  3. Salva l’immagine di output in un file jpeg.
  4. Salva il file PDF aggiornato.

Estrai immagini da PDF - Python

Questo codice di esempio mostra come estrarre immagini da documenti PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Open document
    Document pdfDocument = new Document(dataDir+ "ExtractImages.pdf");

    // Extract a particular image
    XImage xImage = pdfDocument.Pages[1].Resources.Images[1];

    FileStream outputImage = new FileStream(dataDir + "output.jpg", FileMode.Create);

    // Save output image
    xImage.Save(outputImage, ImageFormat.Jpeg);
    outputImage.Close();

    dataDir = dataDir + "ExtractImages_out.pdf";

    // Save updated PDF file
    pdfDocument.Save(dataDir);

Informazioni su Aspose.PDF per l'API Python for .NET

Aspose.PDF per Python tramite API .NET supporta gli standard PDF e le specifiche PDF più diffusi. Consente agli sviluppatori di inserire tabelle, grafici, immagini, collegamenti ipertestuali, caratteri personalizzati e altro ancora nei documenti PDF. Inoltre, è anche possibile comprimere documenti PDF. Aspose.PDF per Python tramite .NET offre eccellenti funzionalità di sicurezza per sviluppare documenti PDF sicuri. Alcune delle funzionalità principali di Aspose.PDF per Python tramite API .NET includono:

  • Possibilità di leggere ed esportare PDF in diversi formati di immagine tra cui BMP, GIF, JPEG e PNG.
  • Imposta le informazioni di base (ad esempio autore, creatore) del documento PDF.
  • Funzionalità di conversione: converti PDF in Word, Excel e PowerPoint. Converti PDF in formati di immagini. Converti file PDF in formato HTML e viceversa. Converti PDF in EPUB, testo, XPS, ecc.

Puoi trovare ulteriori informazioni su Aspose.PDF per Python tramite l’API .NET nella nostra documentazione su come usare l’API.