通过 JavaScript 提取 PDF 元数据

从 PDF 文档中提取元数据。使用 Aspose.PDF for Node.js via C++ 以编程方式修改 PDF 文件

如何使用 Node.js via C++ 库提取 PDF 元数据

使用适用于 Node.js 的 Aspose.PDF 从 PDF 中提取元数据。访问文档的元数据意味着获取有关该文件的信息,例如其标题、作者、创建时间和特定关键字。提取元数据有助于更有效地组织大量 PDF 集合。从元数据提取的数据改进了搜索文件的方式。用户可以使用提取的元数据中的关键字或详细信息快速找到特定的文档。提取元数据可以让人们深入了解文件所包含的内容。它可能会提供有关该文件的关键细节的简要摘要,从而无需打开文档即可更轻松地理解文档。提取元数据有助于确保文档的真实性。您可以查看详细信息,例如创建时的作者姓名或其修改历史记录。这种验证对于确认 PDF 的可靠性至关重要。通过提供有关 PDF 内容的简明细节,提取的元数据使用户体验要好得多。它可以帮助用户轻松识别和处理文档。提取 PDF 元数据具有许多优点,例如更高效的文档管理、改进的搜索选项、符合标准以及增强的用户体验。通过 Aspose 从 PDF 中提取元数据,并解决数据处理中的所有必要任务。Aspose.PDF for Node.js via C++ 帮助提取嵌入在 PDF 文档中描述其属性、属性和内容的信息。这包括诸如标题、作者、创作者、作者、主题、关键字以及文档 PDF 的创建/修改日期等信息。根据特定 PDF 文件的属性,提取这些元数据可用于组织、分类和搜索特定 PDF 文件。要获取 PDF 文件信息,我们将使用 Aspose.PDF for Node.js via C++,这是一款简单安全的工具包,用于直接在网络浏览器中处理 PDF。要通过 C++ 安装和使用适用于 Node.js 的 Aspose.PDF,请从 ZIP 存档 中提取文件。

通过 JavaScript 提取 PDF 元数据


你需要 Aspose.PDF for Node.js via C++ 才能在你的环境中试用代码。

1。导入 Aspose.PDF 模块。 1。为输入文件定义一个常量。 1。调用 asposePDF 函数。 致电 asposePDFGetInfo 使用 console.log 方法

提供的 JavaScript 代码片段展示了如何通过 Aspose.PDF 库从 PDF 中提取元数据。它会打开一个名为 “GetFileInfo.pdf” 的 PDF 文件,该文件位于变量 “DIR_INPUT_METADATA” 指定的目录中。该代码使用 “info” 函数从文档中检索各种详细信息。它显示 PDF 中的特定元数据信息,例如作者姓名、创建日期、关键字、修改日期、主题和标题。该代码使用 “打印” 功能来显示此信息。此代码片段是如何使用 Aspose.PDF 库或框架从 PDF 文件中提取元数据的简化示例。

提取 PDF 的元数据-JavaScript

此示例代码显示如何提取 PDF 文件的元数据信息

Input file:

File not added

Output format:

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Get info (metadata) from a PDF-file*/
    const json = AsposePdfModule.AsposePdfGetInfo(pdf_file);
    console.log("AsposePdfGetInfo => %O", json.errorCode == 0 ? 'Title: ' + json.title : json.errorText);
});