通过 C# 将 PDF 合并到 TEXT

将 PDF 文档合并为单一格式 TEXT。程序员可以使用此示例代码通过 COM Interop 将.NET Framework、.NET Core 和 PHP、VbScript、Delphi、C++ 上的 PDF 合并。

使用 C# 将 PDF 合并到 TEXT

如何将 PDF 合并到 TEXT?使用 Aspose.PDF for .NET 库,你可以轻松地以编程方式将 PDF 合并到 TEXT。Aspose 的 PDF 软件非常适合个人以及小型或大型企业。由于它能够处理大量信息,因此可以快速高效地进行连接并保护您的数据。Aspose.PDF 的一个特殊功能是用于将 PDF 合并到 TEXT 的 API。

这种方法的特点是,你只需要打开 NuGet 包管理器,搜索 “aspose.pdf for .NET”,然后安装它,无需任何特殊的复杂设置。(使用包管理器控制台中的命令进行安装)。为了将 PDF 转换为 TEXT,我们将使用 Aspose.PDF for .NET API,它是一个功能丰富、强大且易于使用的.NET 平台转换 API。在 文档 页面上查看安装库的详细信息。要验证该库的优点,请尝试使用将 PDF 转换为 TEXT 的代码片段。

Package Manager Console

PM > Install-Package Aspose.PDF

如何通过 C# 将 PDF 合并到 TEXT


.NET 开发人员只需几行代码即可轻松地将 PDF 文件加载并合并到 TEXT。

  1. 阅读两个 PDF 文件
  2. 创建文本吸收器
  3. 通过对两个 PDF 应用 TextAbSorber 从 PDF 中提取文本
  4. 存储提取的文本
  5. 将提取的文本写入文件

以下示例演示了如何在 C# 中将 PDF 与 TEXT 合并。轻松地将多个文档合并为一个文件。如果您在 C# 中开发代码,则此任务可能比听起来要简单。可以将完全限定的文件名用于 PDF 读取和 TEXT 写入。看看这个 C# 示例,该示例展示了如何使用 C# 将多个相同或不同文件类型的文档合并为一个文件

使用 .NET 合并 PDF 文件并另存为 TEXT

示例 C#:此示例代码显示了 PDF 到 TEXT 的连接

Input file:

File not added

File not added

Output format:

TEXT

Output file:

// read pdf file to Aspose Document
var firstDoc = new Aspose.Pdf.Document("1.pdf");
var secondDoc = new Aspose.Pdf.Document("2.pdf");

// create text absorber for extract text
textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
firstDoc.Pages.Accept(textAbsorber);
secondDoc.Pages.Accept(textAbsorber);
string extractedText = textAbsorber.Text;
File.WriteAllText("merger_pdf_text.txt", extractedText);

.NET 可将 PDF 合并到 TEXT 的库

Aspose.PDF for C# API 为处理 PDF 文件提供了广泛的功能。其中一些功能包括:

  • 从头开始创建 PDF 文档,也可以从 HTML、XML 或图像创建 PDF 文档。
  • 通过添加或删除页面、文本、图像和其他内容来编辑现有 PDF 文档。
  • 将 PDF 文档转换为其他格式,例如 HTML、XML 和图像。
  • 将 PDF 文档呈现为图像或 XPS 格式。
  • 直接从您的应用程序打印 PDF 文档。
  • 对 PDF 文档进行数字签名。

你可以在这个 Aspose 文档 中找到有关 C# API 版 Aspose.PDF 的更多信息