需要以編程方式將文檔從 PDF 轉換為 TXT 格式?借助Aspose.Words for Python via .NET,任何開發人員只需幾行 Python 代碼即可將文檔從 PDF 轉換為 TXT 格式。
現代文檔處理 Python API 以專業品質從 PDF 創建 TXT 文檔。直接在瀏覽器中測試最高質量的 PDF 到 TXT 轉換。強大的 Python 庫允許將 PDF 文件轉換為幾乎所有 TXT 文檔格式。
以下示例演示瞭如何在 Python 中將 PDF 轉換為 TXT 文檔格式。
按照簡單的步驟將 PDF 文件轉換為 TXT 文檔格式。從本地驅動器讀取 PDF 文件,然後將其保存為 TXT 文檔格式,並通過所需的 TXT 擴展名指定所需的文件格式。對於 PDF 讀取和 TXT 文檔寫入,您可以使用完全限定的文件名。輸出 TXT 內容和格式將與原始 PDF 文檔相同。
pip install aspose-words
複製
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document(Input.pdf)
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.txt")
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
builder.insert_image("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
shape = builder.insert_image("Input.pdf")
shape.get_shape_renderer().save("Output.txt", aw.saving.ImageSaveOptions(aw.SaveFormat.txt))
我們在PyPi存儲庫中託管我們的 Python 請按照有關如何 "Aspose.Words for Python via .NET" 安裝到您的開發人員環境的分步說明進行操作。
這個包與 Python ≥3.5 和 <3.12 兼容。如果您為 Linux 開發軟件,請查看產品文檔中對 gcc 和 libpython 的附加要求。
您可以將PDF轉換為許多其他文件格式: