Java 経由で PDF メタデータを抽出

PDF ドキュメントからメタデータを抽出します。プログラムで PDF ファイルを変更するには、Aspose.PDF for Java を使用してください

Java ライブラリを使用して PDF メタデータを抽出する方法

Java 用 Aspose.PDF を使用して PDF からメタデータを抽出します。文書のメタデータにアクセスするということは、タイトル、作成者、作成日、特定のキーワードなど、そのファイルに関する情報を取得することを意味します。メタデータを抽出すると、大量の PDF コレクションをより効果的に整理できます。メタデータから抽出されたデータにより、ファイルの検索方法が向上します。ユーザーは、抽出されたメタデータに含まれるキーワードや詳細を使用して、特定の文書をすばやく見つけることができます。メタデータを抽出すると、ファイルに何が含まれているかについての貴重な洞察が得られます。ファイルに関する重要な詳細の簡単な概要が表示されるため、ファイルを開かなくても文書の内容を理解しやすくなります。メタデータを抽出すると、文書が本物であることを確認できます。作成時の作成者名や変更履歴などの詳細を確認できます。この検証は PDF の信頼性を確認するために不可欠です。PDF の内容に関する簡潔な詳細を提供することで、抽出されたメタデータはユーザーエクスペリエンスを大幅に向上させます。これにより、ユーザーは文書を簡単に識別して操作できます。全体として、PDF メタデータを抽出することには、文書管理の効率化、検索オプションの向上、標準への準拠、全体的なユーザーエクスペリエンスの向上など、多くの利点があります。Asposeを使用してPDFからメタデータを抽出し、データ処理に必要なすべてのタスクを解決できます。PDF ファイルからメタデータを抽出するには、Aspose.PDF for Java API を使用します。これは Java プラットフォーム向けの機能が豊富で強力で使いやすい変換 API です。pom.xml に以下の設定を追加することで、最新バージョンを Maven から直接ダウンロードして Maven ベースのプロジェクトにインストールできます。

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Java 経由で PDF メタデータを抽出


ご使用の環境でコードを試すには、Aspose.PDF for Java が必要です。

1。Document のインスタンスを持つ PDF を読み込みます。 1。Document.Info プロパティを使用してドキュメント情報を取得します。 1。さまざまな Document.Info プロパティにアクセスして表示します。

提供されている Java コードスニペットは、Aspose.PDF ライブラリによって PDF からメタデータを抽出する方法を示しています。変数 ‘DIR_INPUT_METADATA’ で指定されたディレクトリにある ‘GetFileInfo.pdf’ という名前の PDF ファイルを開きます。このコードでは、「info」関数を使用して文書からさまざまな詳細情報を取得します。作成者名、作成日、キーワード、変更日、件名、タイトルなど、PDF 内の特定のメタデータ情報が表示されます。このコードは「print」機能を使用してこの情報を表示します。このコードスニペットは、Aspose.PDF ライブラリまたはフレームワークを使用して PDF ファイルからメタデータを抽出する方法の簡単な例です。

PDF のメタデータを抽出-Java

このサンプルコードは、PDF ファイルのメタデータ情報を抽出する方法を示しています。

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());