通过 Python 提取 PDF 元数据

如何使用 Python for .NET 库编辑 PDF 元数据

如何使用 Python for .NET 库提取 PDF 元数据

为了从 PDF 文件中提取元数据,我们将使用 Aspose.PDF for .NET API,这是一款功能丰富、功能强大且易于使用的适用于 .NET 的文档处理 API。打开 NuGet 软件包管理器,搜索 aspose.pdf 然后安装。您也可以从软件包管理器控制台使用以下命令。

Python Package Manager Console

pip install aspose-pdf

通过 Python 提取 PDF 元数据


要在你的环境中试用这些代码,你需要 Aspose.PDF for .NET

1.加载带有文档实例的 PDF。 1.使用 Document.Info 属性获取 DocumentInfo 1.访问和显示不同的 Document.Info 属性。

<% metadata.code-block.text %>

提取 PDF 的元数据-Python。

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)