Extrahieren Sie PDF-Metadaten über Python

So bearbeiten Sie PDF-Metadaten mit der Bibliothek Python for .NET

So extrahieren Sie PDF-Metadaten mithilfe der Python for .NET Bibliothek

Um Metadaten aus PDF-Dateien zu extrahieren, verwenden wir die API Aspose.PDF for .NET, eine funktionsreiche, leistungsstarke und einfach zu bedienende Dokumentbearbeitungs-API für .NET. Öffnen Sie den NuGet -Paketmanager, suchen Sie nach Aspose.pdf und installieren Sie es. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Python Package Manager Console

pip install aspose-pdf

Extrahieren Sie PDF-Metadaten über Python


Um den Code in Ihrer Umgebung auszuprobieren, benötigen Sie Aspose.PDF for .NET.

  1. Laden Sie das PDF mit einer Instanz von Document.
  2. Rufen Sie DocumentInfo mithilfe der Eigenschaft Document.Info
  3. Zugriff auf und Anzeige verschiedener Document.Info-Eigenschaften.

<% metadata.code-block.text %>

Extrahieren Sie Metadaten aus PDF - Python

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)