Estrai i metadati PDF tramite Python

Come modificare i metadati PDF utilizzando la libreria Python for .NET

Come estrarre i metadati PDF utilizzando la libreria Python for .NET

Per estrarre i metadati dai file PDF, useremo l’API Aspose.PDF for .NET, che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per .NET. Apri il gestore di pacchetti NuGet, cerca Aspose.pdf e installa. È inoltre possibile utilizzare il seguente comando dalla console di Package Manager.

Python Package Manager Console

pip install aspose-pdf

Estrai i metadati PDF tramite Python


Per provare il codice nel tuo ambiente, devi Aspose.PDF for .NET.

  1. Carica il PDF con un’istanza di Document.
  2. Ottenere DocumentInfo utilizzando la proprietà Document.
  3. Accedere e visualizzare diverse proprietà Document.Info.

<% metadata.code-block.text %>

Estrai i metadati del PDF - Python

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)