通过 Python for .NET 拆分文件

在服务器端 Python for .NET 库的帮助下拆分文件。

使用 Python for .NET 库拆分文件

只需要大文件的一部分吗?要从文档中分离一个或多个部分,必须拆分原始文件的页面。为了拆分文件,我们将使用 Aspose.PDF for Python API,这是一款适用于 python-net 平台的功能丰富、强大且易于使用的文档操作 API。打开 NuGet 包管理器,搜索 aspose.pdf 并安装。您也可以使用软件包管理器控制台中的以下命令。我们的软件工具还为开发人员提供了将 Word、PDF、HTML、TXT 和 DOCX 文档拆分成几个部分。欲了解更多详情,请学习 文档页面

Python Package Manager Console

pip install aspose-pdf

通过 Python 拆分文档


您需要 [Aspose.PDF用於.NET](https://releases.aspose.com/pdf/net) 在您的環境中嘗試代碼。

  1. 載入包含文件實例的 PDF。 創建一個新的文件類物件來拆分PDF頁面。
  2. 將目前頁面添加到文件中。
  3. 將目前頁面另存為單獨的 PDF

如何使用 Python 拆分 PDF

使用 Aspose.PDF for Python 库,你可以拆分大型 PDF 文档。分割 PDF 文档是处理 PDF 文档时的常见用例。它通过将大型文档分解为较小的文件以通过电子邮件发送,从而帮助减小PDF文件的大小。

拆分 PDF-Python。

<% splitter.code-block1.subtitle %>

 doc = aspose.pdf.Document("1.pdf")

 pdf_editor = aspose.pdf.PdfFileEditor()
 pdf_editor.Extract(path_source, 1, doc.Pages.Count / 2, "pdf_half.pdf")

如何使用 Python 拆分 HTML 文件

HTML 文档可能很大,因为它们可以包含文本、图像、图表等。您可能需要根据不同的要求或用例分开 HTML 文件。Aspose.PDF for Python 库将帮助你完成这项任务。

拆分 HTML-Python。

<% splitter.code-block2.subtitle %>

 doc = aspose.pdf.Document("test.pdf");

 # save input html to pdf to file
 doc = aspose.pdf.Document("1.html", HtmlLoadOptions);
 doc.Save("test.pdf", SaveFormat.PDF);

 # slit first page
 pdf_editor = aspose.pdf.PdfFileEditor();
 pdf_editor.SplitFromFirst("test.pdf", 1, "test.pdf");
 doc.Save("html_first.html", SaveFormat.HTML);

如何使用 Python 拆分 TXT 文件

Aspose.PDF for Python 库允许 Python 开发者将 TXT 文件拆分为不同的部分。将 TXT 文档拆分成单独文件的功能将帮助您同时为多个用户处理大型文档的不同部分。拆分 TXT 文档将加快和简化您的工作。使用以下代码片段提取 TXT 文件的页面。

拆分 TXT-Python。

<% splitter.code-block3.subtitle %>

# save input text to pdf to file
doc = aspose.pdf.Document("1.txt", TxtLoadOptions())
doc.Save("test.pdf", SaveFormat.PDF)
index = 1

pages = pdf_editor.SplitToPages("test.pdf")
pdf_editor = aspose.pdf.PdfFileEditor()

for ms in pages:
    page = aspose.pdf.Document(ms)
    text_absorber = aspose.pdf.TextAbsorber()
    page.Pages.Accept(text_absorber)
    extracted_text = text_absorber.Text
    file = open("text_"+str(index)+".txt", "w+")
    file.write(extracted_text)
    index = index + 1

關於 Python API 的 aspose.PDF

一个 PDF 处理库,用于创建跨平台应用程序,无需使用 Adobe Acrobat 即可生成、修改、转换、呈现、保护和打印文档。它支持将各种文件格式转换为包括HTML在内的PDF,并将PDF文档转换为各种输出格式。开发人员可以轻松地在单页 PDF 中呈现所有 HTML 内容,也可以将带有 SVG 图形标签的 HTML 文件转换为带标签的 PDF 文件。.NET PDF API 提供压缩、表格创建、图形和图像功能、超链接、图章和水印任务、扩展的安全控制和自定义字体处理。