现代 Python 库允许 Python via .NET 开发人员使用几行代码 PDF 组合成一个 TXT 我们的 PDF 转换引擎会分析原始的 PDF 布局和结构,并将合并后的内容导出为 TXT 格式。
使用 Python 以最大的灵活性和速度 PDF 转换为 TXT 运行在线演示并在浏览器中 TXT PDF 转换 API 支持一堆有用的选项。
要将多个 PDF 转换为 TXT 只需使用处理所有低级细节的 Python
转换多个 PDF 并将结果保存为单个 TXT 文件。如果您使用 Python 开发代码,这将比听起来简单。请参阅 Python 示例,该示例遍历文档并将它们转换为 TXT 格式:
pip install aspose-words
复制
import aspose.words as aw
fileNames = [ "Input1.pdf", "Input2.pdf" ]
output = aw.Document()
# 在追加之前从目标文档中删除所有内容。
output.remove_all_children()
for fileName in fileNames:
input = aw.Document(fileName)
# 将源文档附加到目标文档的末尾。
output.append_document(input, aw.ImportFormatMode.KEEP_SOURCE_FORMATTING)
output.save("Output.txt");
我们在PyPi存储库中托管我们的 Python 请按照有关如何 "Aspose.Words for Python via .NET" 安装到您的开发人员环境的分步说明进行操作。
这个包与 Python ≥3.5 和 <3.12 兼容。如果您为 Linux 开发软件,请查看产品文档中对 gcc 和 libpython 的附加要求。
您可以将PDF合并为许多其他文件格式: