Converti PDF in XML tramite Python

Conversione da PDF a XML Python. I programmatori possono utilizzare questo codice di esempio per esportare PDF in XML all’interno di qualsiasi .NET Framework, .NET Core e PHP, VBScript, C++ tramite COM Interop.

Converti PDF in XML in Python via .NET

Come convertire PDF in XML? È possibile convertire facilmente un documento dal formato PDF al formato XML tramite codice, utilizzando una moderna API Python per l’elaborazione dei documenti. Bastano poche righe di codice per convertire file di alta qualità. La libreria Aspose.PDF consente a qualsiasi sviluppatore di risolvere facilmente le operazioni di conversione da PDF a XML utilizzando Python.

Per una descrizione più dettagliata del frammento di codice e di altri possibili formati di conversione, consultare le pagine di Documentazione. È inoltre possibile consultare le altre conversioni dei formati supportati dalla nostra libreria.

Con la libreria Aspose.PDF for Python via .NET è possibile convertire PDF in XML tramite codice. Il software PDF di Aspose è ideale per privati, piccole e grandi aziende. Essendo in grado di elaborare una grande quantità di informazioni, esegue la conversione in modo rapido ed efficiente, proteggendo i dati. Una caratteristica peculiare di Aspose.PDF è un’API per convertire PDF in XML. La caratteristica di questo approccio è che è sufficiente aprire il gestore pacchetti PyPI, cercare aspose-pdf e installarlo senza particolari impostazioni complesse. Per verificare i vantaggi della libreria, prova a utilizzare il frammento di codice per la conversione da PDF a XML. Puoi anche utilizzare il seguente comando dalla console o dal terminale:

Console

pip install aspose-pdf

Come convertire PDF in XML


Gli sviluppatori di Python via .NET possono facilmente caricare e convertire file PDF in XML in poche righe di codice.

  1. Importa i moduli richiesti dalla libreria aspese.pdf, inclusa la classe Document per il caricamento dei file PDF.Assicurati che le librerie necessarie siano installate e importate prima di procedere.
  2. Specificare il percorso del documento PDF di input unendo indir con l’infile, assicurando la corretta struttura della directory per localizzare correttamente il file di input.
  3. Crea un’istanza dell’oggetto Documento e carica il file PDF di input specificato.Questo passaggio è necessario per accedere al contenuto PDF per ulteriori elaborazioni.
  4. Crea un’istanza dell’oggetto PdfXmlSaveOptions, che verrà utilizzato per specificare il formato di output come file XML PDF.Questo formato è utile per convertire file PDF complessi con layout e formattazione in un formato più modificabile.
  5. Utilizzare il documento PDF caricato e l’oggetto PdfXmlSaveOptions creato per salvare il file in formato PDF XML, che convertirà il contenuto PDF in un formato XML-based che può essere modificato.
  6. Stampa un messaggio di successo che indica che il PDF di input è stato convertito in un file XML PDF, insieme ai nomi di file di input e output per riferimento.

Ecco un esempio che dimostra come convertire PDF in XML in Python. Puoi seguire questi semplici passaggi per convertire il tuo file PDF nel formato XML. Per prima cosa, carica il tuo file PDF e poi salvalo semplicemente come file XML. Puoi usare nomi di file completi sia per la lettura di PDF che per la scrittura di XML. Il contenuto e la formattazione dell’output XML saranno identici al documento originale PDF.

Esempio: convertire PDF in XML tramite Python

Questo codice di esempio mostra la conversione da PDF a XML Python

Input file:

File not added

Output format:

XML

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
save_options = apdf.PdfXmlSaveOptions()
document.save(path_outfile, save_options)

print(infile + " converted into " + outfile)

Converti PDF in XML usando Python via .NET

Aspose.PDF per Python tramite API.NET supporta gli standard PDF e le specifiche PDF più consolidati. Consente agli sviluppatori di inserire tabelle, grafici, immagini, collegamenti ipertestuali, caratteri personalizzati e altro ancora nei documenti PDF. Inoltre, è anche possibile comprimere documenti PDF. Aspose.PDF per Python tramite .NET offre eccellenti funzionalità di sicurezza per sviluppare documenti PDF sicuri. Alcune delle funzionalità principali di Aspose.PDF per Python tramite API.NET includono:

  • Possibilità di leggere ed esportare PDF in più formati di immagine tra cui BMP, GIF, JPEG e PNG.
  • Imposta le informazioni di base (ad esempio autore, creatore) del documento PDF.
  • Funzionalità di conversione: converti PDF in Word, Excel e PowerPoint. Converti i formati PDF in immagini. Converti file PDF in formato HTML e viceversa. Converti PDF in EPUB, testo, XPS, ecc.

Puoi trovare maggiori informazioni su Aspose.PDF per Python tramite l’API.NET nella nostra documentazione su come usare l’API.