Italiano
  1. Prodotti
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   Estrai testo e immagini da file PDF online e utilizzando Python

Analizza file PDF online ed estrai testo o immagini tramite Python

Sviluppa una potente applicazione di utilità parser di documenti PDF basata su Python.Codice elencato per immagini di documenti PDF ed estrazione di testo tramite Python.

Analizza il documento PDF tramite l'app online

  1. Importa il file PDF da analizzare caricandolo.
  2. Fallo facendo clic all’interno dell’area di rilascio tramite trascinamento della selezione dell’app parser.
  3. A seconda della dimensione del file PDF e della velocità di Internet, attendere alcuni secondi.
  4. Fare clic sul pulsante “Analizza ora” per analizzare il documento.
  5. Scarica i file analizzati per visualizzarli immediatamente.

Estrai testo dal file PDF tramite Python

  1. API di riferimento all’interno del progetto direttamente da PyPI ( Aspose.Words )
  2. Carica il file PDF utilizzando la classe Document
  3. Utilizza il metodo di salvataggio per salvarlo come file .txt
  4. Tutto il contenuto PDF viene visualizzato in testo
 

Esempio di codice in Python per estrarre il testo del documento PDF

 

Estrai immagini dal file PDF tramite Python

  1. API di riferimento all’interno del progetto direttamente da PyPI ( Aspose.Words )
  2. Caricare il PDF utilizzando l’oggetto classe Document
  3. Salvare il file come file Word
  4. Carica il file Word utilizzando l’oggetto classe Document
  5. Immagini archiviate nei nodi Forma in un oggetto Document
  6. Per selezionare tutti i nodi Forma, utilizzare il metodo Document.get_child_nodes
  7. Passa attraverso le raccolte di nodi risultanti
  8. Se Shape.has_image restituisce true.
  9. Utilizza la proprietà Shape.image_data per estrarre i dati dell’immagine.
  10. Salvare i dati dell’immagine in un file
 

Esempio di codice in Python per estrarre le immagini del documento PDF

 
 

Develop PDF File Parser Application via Python

Hai bisogno di sviluppare un’app o un’utilità parser PDF?Con Aspose.Words for Python via .NET , un’API figlia di Aspose.Total for Python via .NET , qualsiasi sviluppatore Python può integrare il codice API di cui sopra all’interno della propria applicazione di analisi dei documenti.La potente libreria Python consente di programmare qualsiasi soluzione di analisi dei documenti per estrarre immagini e testo.Inoltre può supportare molti formati popolari incluso il formato PDF.

Utilità Python per elaborare il file PDF per l'app parser

Esistono opzioni alternative per installare “ Aspose.Words for Python via .NET ” o “ Aspose.Total for Python via .NET ” sul tuo sistema.Scegline uno che soddisfi le tue esigenze e segui le istruzioni passo passo:

Requisiti di sistema

  • È installato Python 3.5 o successivo
  • Librerie runtime GCC-6 (o successive).
  • Per Python 3.5-3.7: è necessaria la build pymalloc di Python.

    Per maggiori dettagli fare riferimento a Product Documentation .

Domande frequenti

  • Posso utilizzare il codice Python sopra nella mia applicazione?
    Sì, puoi scaricare questo codice e utilizzarlo allo scopo di sviluppare un'applicazione di analisi dei documenti basata su Python.Questo codice può rappresentare una risorsa preziosa per migliorare la funzionalità e le capacità dei tuoi progetti nel campo dell'elaborazione dei documenti backend come la lettura dei nodi e il caricamento del documento per l'estrazione di testo e immagini.
  • Questa app per l'analisi dei documenti online funziona solo su Windows?
    Hai la flessibilità di avviare l'analisi dei documenti su qualsiasi dispositivo, indipendentemente dal sistema operativo su cui viene eseguito, sia esso Windows, Linux, Mac OS o Android.Tutto ciò che serve è un browser web moderno e una connessione Internet attiva.
  • È sicuro utilizzare l'app online per analizzare il documento PDF?
    Ovviamente! I file di output generati tramite il nostro servizio verranno rimossi in modo sicuro e automatico dai nostri server entro un periodo di 24 ore.Di conseguenza, i collegamenti di visualizzazione associati a questi file cesseranno di essere funzionali dopo tale periodo.
  • Quale browser dovrebbe utilizzare l'app?
    Puoi utilizzare qualsiasi browser Web moderno come Google Chrome, Firefox, Opera o Safari per il parser di documenti PDF online. Tuttavia, se stai sviluppando un'applicazione desktop, ti consigliamo di utilizzare l'API di elaborazione dei documenti Aspose.Total per una gestione efficiente.

Esplorare Analizzatore di file Opzioni con Python

Analizzare DOC File (Formato binario di Microsoft Word)
Analizzare DOCX File (Office 2007+ Documento Word)
Analizzare DOT File (File modello di Microsoft Word)
Analizzare DOTX File (File modello di Microsoft Word)
Analizzare ODP File (Formato di presentazione OpenDocument)
Analizzare ODT File (Formato file di testo OpenDocument)
Analizzare OTT File (Modello OpenDocument)
Analizzare PDF File (Formato documento portatile)
Analizzare POWERPOINT File (File di presentazione)
Analizzare PPT File (Presentazione Powerpoint)
Analizzare PPTX File (Apri il formato di presentazione XML)
Analizzare RTF File (Formato RTF)
Analizzare WORD File (Formati di file di elaborazione testi)