通過Python提取 PDF 元數據

如何使用 Python for .NET 庫編輯 PDF 元數據

如何使用 Python for .NET 庫提取 PDF 元數據

為了從 PDF 檔中提取元數據,我們將使用 [Aspose.PDF for .NET](https://products.aspose.com/pdf/net) API,這是一個功能豐富、功能強大且易於使用的文檔操作 API。打開 [NuGet](https://www.nuget.org/packages/aspose.pdf) 包管理器,搜索“.PDF”並安裝。您也可以從程式包管理器主控台使用以下命令。

Python Package Manager Console

pip install aspose-pdf

通過Python提取 PDF 元數據


若要在你的環境中嘗試代碼,你需要 Aspose.PDF for .NET.

  1. 載入包含文件實例的 PDF。
  2. 使用 Document.Info 屬性獲取文件資訊。 1.訪問和顯示不同的 Document.Info 屬性。

<% metadata.code-block.text %>

提取 PDF 的元資料 - Python

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)