需要以编程方式将文档从 PDF 转换为 TXT 格式?借助Aspose.Words for Python via .NET,任何开发人员只需几行 Python 代码即可将文档从 PDF 转换为 TXT 格式。
现代文档处理 Python API 以专业品质从 PDF 创建 TXT 文档。直接在浏览器中测试最高质量的 PDF 到 TXT 转换。强大的 Python 库允许将 PDF 文件转换为几乎所有 TXT 文档格式。
以下示例演示了如何在 Python 中将 PDF 转换为 TXT 文档格式。
按照简单的步骤将 PDF 文件转换为 TXT 文档格式。从本地驱动器读取 PDF 文件,然后将其保存为 TXT 文档格式,并通过所需的 TXT 扩展名指定所需的文件格式。对于 PDF 读取和 TXT 文档写入,您可以使用完全限定的文件名。输出 TXT 内容和格式将与原始 PDF 文档相同。
pip install aspose-words
复制
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document("Input.pdf")
save_options = aw.saving.ImageSaveOptions(aw.SaveFormat.txt)
for page in range(doc.page_count):
save_options.page_set = aw.saving.PageSet(page)
doc.save(f"Output_{page + 1}.txt", save_options)
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
builder.insert_image("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
shape = builder.insert_image("Input.pdf")
shape.get_shape_renderer().save("Output.txt", aw.saving.ImageSaveOptions(aw.SaveFormat.txt))
我们在PyPi存储库中托管我们的 Python 请按照有关如何 "Aspose.Words for Python via .NET" 安装到您的开发人员环境的分步说明进行操作。
这个包与 Python ≥3.5 和 <3.12 兼容。如果您为 Linux 开发软件,请查看产品文档中对 gcc 和 libpython 的附加要求。
您可以将PDF转换为许多其他文件格式: