通过 .NET 拆分文件

在服务器端 .NET 库的帮助下拆分文件。

使用 .NET 库拆分文件

只需要大文件的一部分吗?要从文档中分离一个或多个部分,必须拆分原始文件的页面。为了拆分文件,我们将使用 Aspose.PDF for .NET API,这是一款适用于 net 平台的功能丰富、强大且易于使用的文档操作 API。打开 NuGet 包管理器,搜索 aspose.pdf 并安装。您也可以使用软件包管理器控制台中的以下命令。我们的软件工具还为开发人员提供了将 Word、PDF、HTML、TXT 和 DOCX 文档拆分成几个部分。欲了解更多详情,请学习 文档页面

Package Manager Console

PM > Install-Package Aspose.PDF

通过 C# 拆分文档


你需要 Aspose.PDF for .NET 在你的环境中试用代码。

1.加载带有文档实例的 PDF。 1.创建一个新的文档类对象来拆分 PDF 页面。 1.将当前页面添加到文档中。 1.将当前页面另存为单独的 PDF

如何使用 C# 拆分 PDF

使用适用于.NET 的 Aspose.PDF 库,您可以拆分大型 PDF 文档。分割 PDF 文档是处理 PDF 文档时的常见用例。它通过将大型文档分解为较小的文件以通过电子邮件发送,从而帮助减小PDF文件的大小。

拆分 PDF-C#。

<% splitter.code-block1.subtitle %>

var pdfEditor = new PdfFileEditor();
fs = new FileStream("1.pdf", FileMode.Open, FileAccess.Read);
doc = new Document(fs);
pdfEditor.Extract(pathSource, 1, doc.Pages.Count / 2, "pdf_half.pdf");

如何使用 C# 拆分 HTML 文件

HTML 文档可能很大,因为它们可以包含文本、图像、图表等。您可能需要根据不同的要求或用例分开 HTML 文件。适用于.NET 的 Aspose.PDF 库将帮助你完成这项任务。

拆分 HTML-C#。

<% splitter.code-block2.subtitle %>

//save input html to pdf to file
doc = new Document("1.html", new HtmlLoadOptions());
doc.Save("test.pdf", SaveFormat.Pdf);

var pdfEditor = new PdfFileEditor();
pdfEditor.SplitFromFirst("test.pdf", 1, "test.pdf");
doc = new Document("test.pdf");
doc.Save("html_first.html", SaveFormat.Html);

如何使用 C# 拆分 TXT 文件

afor .NET 的 Aspose.PDF 库允许 C# 开发人员将 TXT 文件拆分为不同的部分。将 TXT 文档拆分成单独文件的功能将帮助您同时为多个用户处理大型文档的不同部分。拆分 TXT 文档将加快和简化您的工作。使用以下代码片段提取 TXT 文件的页面。

拆分 TXT-C#。

<% splitter.code-block3.subtitle %>

//save input text to pdf to file
pdfEditor = new PdfFileEditor();
var doc = new Document("1.txt", new TxtLoadOptions());
doc.Save("test.pdf", SaveFormat.Pdf);

MemoryStream [] pages = pdfEditor.SplitToPages("test.pdf");

int index = 1;
foreach(var ms in pages)
{
    page = new Document(ms);
    var textAbsorber = new TextAbsorber();
    page.Pages.Accept(textAbsorber);
    string extractedText = textAbsorber.Text;
    File.WriteAllText("text_"+index+".txt", extractedText);
    index++;
}