通过 PHP 提取 PDF 元数据

从 PDF 文档中提取元数据。使用 Aspose.PDF for PHP via Java 以编程方式修改 PDF 文件

如何使用 PHP via Java 库提取 PDF 元数据

使用适用于 .NET 的 Aspose.PDF 从 PDF 中提取元数据。访问文档的元数据意味着获取有关该文件的信息,例如其标题、作者、创建时间和特定关键字。提取元数据,有助于更有效地组织大量 PDF 集合。从元数据提取的数据改进了搜索文件的方式。用户可以使用提取的元数据中的关键字或详细信息快速找到特定的文档。提取元数据可以为文件包含的内容提供宝贵的见解。它可能会提供有关该文件的关键细节的简要摘要,从而无需打开即可更轻松地理解文档的内容。提取元数据有助于确保文档的真实性。您可以查看详细信息,例如创建时的作者姓名或其修改历史记录。这种验证对于确认 PDF 的可靠性至关重要。通过提供有关 PDF 内容的简明细节,提取的元数据使用户体验要好得多。它可以帮助用户轻松识别和处理文档。总体而言,提取 PDF 元数据具有许多优点,例如更高效的文档管理、改进的搜索选项、符合标准以及整体增强的用户体验。通过 Aspose 从 PDF 中提取元数据,并解决数据处理中的所有必要任务。为了从 PDF 文件中提取元数据,我们将通过 Java API 使用适用于 PHP 的 Aspose.PDF,它是 php-java 中功能丰富、强大且易于使用的文档处理工具。在任何地方安装 Tomcat 9.0 版本,添加 aspose.pdf.war,更多细节请查看 GitHub 页面。

通过 PHP 提取 PDF 元数据


你需要 通过 Java 实现 PHP 的 Aspose.PDF 才能在你的环境中试用代码。

1.加载带有文档实例的 PDF。 1.使用 Document.Info 属性获取 DocumentInfo 1.访问和显示不同的 Document.Info 属性。

提供的 PHP 代码片段展示了如何通过 Aspose.PDF 库从 PDF 中提取元数据。它会打开一个名为 “GetFileInfo.pdf” 的 PDF 文件,该文件位于变量 “DIR_INPUT_METADATA” 指定的目录中。该代码使用 “info” 函数从文档中检索各种详细信息。它显示 PDF 中的特定元数据信息,例如作者姓名、创建日期、关键字、修改日期、主题和标题。该代码使用 “打印” 功能来显示此信息。此代码片段是如何使用 Aspose.PDF 库或框架从 PDF 文件中提取元数据的简化示例。

提取 PDF 的元数据-PHP

此示例代码显示如何提取 PDF 文件的元数据信息

Input file:

File not added

Output format:

Output file:


    // Open document
    $document = new Document($inputFile);
    
    // Get document information
    $docInfo = $document->getInfo();

    // Show document information
    $responseData1 = "Author: " . $docInfo->getAuthor() . ", ";
    $responseData2 = "Creation Date: " . $docInfo->getCreationDate() . ", ";
    $responseData3 = "Keywords: " . $docInfo->getKeywords() . ", ";
    $responseData4 = "Modify Date: " . $docInfo->getModDate() . ", ";
    $responseData5 = "Subject: " . $docInfo->getSubject() . ", ";
    $responseData6 = "Title: " . $docInfo->getTitle() . "";

    $document->close();