Python 経由で PDF メタデータを抽出

PDF ドキュメントからメタデータを抽出します。プログラムで PDF ファイルを変更するには、Aspose.PDF for Python for .NET を使用してください

Python for .NET ライブラリを使用して PDF メタデータを抽出する方法

Python 用 Aspose.PDF を使用して PDF からメタデータを抽出します。文書のメタデータにアクセスするということは、タイトル、作成者、作成日、特定のキーワードなど、そのファイルに関する情報を取得することを意味します。メタデータを抽出すると、大量の PDF コレクションをより効果的に整理できます。メタデータから抽出されたデータにより、ファイルの検索方法が向上します。ユーザーは、抽出されたメタデータに含まれるキーワードや詳細を使用して、特定の文書をすばやく見つけることができます。メタデータを抽出すると、ファイルに何が含まれているかについての貴重な洞察が得られます。ファイルに関する重要な詳細の簡単な概要が表示されるため、ファイルを開かなくても文書の内容を理解しやすくなります。メタデータを抽出すると、文書が本物であることを確認できます。作成時の作成者名や変更履歴などの詳細を確認できます。この検証は PDF の信頼性を確認するために不可欠です。PDF の内容に関する簡潔な詳細を提供することで、抽出されたメタデータはユーザーエクスペリエンスを大幅に向上させます。これにより、ユーザーは文書を簡単に識別して操作できます。全体として、PDF メタデータを抽出することには、文書管理の効率化、検索オプションの向上、標準への準拠、全体的なユーザーエクスペリエンスの向上など、多くの利点があります。Asposeを使用してPDFからメタデータを抽出し、データ処理に必要なすべてのタスクを解決できます。PDF ファイルからメタデータを抽出するには、Aspose.PDF for .NET API を使用します。これは、機能が豊富で強力で使いやすい.NET 用ドキュメント操作 API です。NuGet パッケージマネージャーを開き、Aspose.PDF を検索してインストールします。パッケージマネージャーコンソールから次のコマンドを使用することもできます。

Python Package Manager Console

pip install aspose-pdf

Python 経由で PDF メタデータを抽出


お使いの環境でコードを試すには、Aspose.PDF for .NET.

1。Document のインスタンスを持つ PDF を読み込みます。 1。Document.Info プロパティを使用してドキュメント情報を取得します。 1。さまざまな Document.Info プロパティにアクセスして表示します。

提供されている Python コードスニペットは、Aspose.PDF ライブラリによって PDF からメタデータを抽出する方法を示しています。変数 ‘DIR_INPUT_METADATA’ で指定されたディレクトリにある ‘GetFileInfo.pdf’ という名前の PDF ファイルを開きます。このコードでは、「info」関数を使用して文書からさまざまな詳細情報を取得します。作成者名、作成日、キーワード、変更日、件名、タイトルなど、PDF 内の特定のメタデータ情報が表示されます。このコードは「print」機能を使用してこの情報を表示します。このコードスニペットは、Aspose.PDF ライブラリまたはフレームワークを使用して PDF ファイルからメタデータを抽出する方法の簡単な例です。

PDF のメタデータを抽出-Python

このサンプルコードは、PDF ファイルのメタデータ情報を抽出する方法を示しています。

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)