Wyodrębnij metadane PDF przez Python

Jak edytować metadane PDF przy użyciu biblioteki Python for .NET

Jak wyodrębnić metadane PDF za pomocą biblioteki Python for .NET

Aby wyodrębnić metadane z plików PDF, użyjemy interfejsu API Aspose.PDF for .NET, który jest bogatym w funkcje, wydajnym i łatwym w użyciu interfejsem API do manipulacji dokumentami dla .NET. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.pdf i zainstaluj. Można również użyć następującego polecenia z konsoli Menedżera pakietów.

Python Package Manager Console

pip install aspose-pdf

Wyodrębnij metadane PDF przez Python


Aby wypróbować kod w swoim środowisku, potrzebujesz Aspose.PDF for .NET.

  1. Załaduj plik PDF z wystąpieniem dokumentu.
  2. Pobierz DocumentInfo za pomocą właściwości Document.info.
  3. Dostęp i wyświetlanie różnych właściwości Document.info.

<% metadata.code-block.text %>

Wyodrębnij metadane PDF - Python

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)