Извлечение метаданных PDF с помощью Python

Как редактировать метаданные PDF с помощью библиотеки Python for .NET

Как извлечь метаданные PDF с помощью библиотеки Python for .NET

Чтобы извлечь метаданные из PDF-файлов, мы будем использовать Aspose.PDF для.NET API, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для.NET. Откройте менеджер пакетов NuGet, найдите Aspose.pdf и установите. Вы также можете использовать следующую команду из консоли Package Manager.

Python Package Manager Console

pip install aspose-pdf

Извлечение метаданных PDF с помощью Python


Чтобы попробовать код в своей среде, вам нужно Aspose.PDF for .NET.

  1. Загрузите PDF-файл с экземпляром документа.
  2. Получить DocumentInfo с помощью свойства Document.
  3. Доступ и отображение различных свойств Document.Info.

<% metadata.code-block.text %>

Извлечь метаданные из PDF — Python

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)