ドキュメントをプログラムで PDF 形式から TXT 形式に変換する必要がありますか? Aspose.Words for Python via .NETを使用すると、開発者はわずか数行の Python コードでドキュメントを PDF から TXT 形式に変換できます。
最新のドキュメント処理 Python API は、プロフェッショナルな品質で PDF から TXT ドキュメントを作成します。最高品質の PDF から TXT への変換をブラウザで直接テストします。強力な Python ライブラリにより、PDF ファイルをほぼすべての TXT ドキュメント形式に変換できます。
次の例は、Python で PDF を TXT ドキュメント形式に変換する方法を示しています。
簡単な手順に従って、PDF ファイルを TXT ドキュメント形式に変換します。ローカル ドライブから PDF ファイルを読み取り、必要な TXT 拡張子で必要なファイル形式を指定して、TXT ドキュメント形式で保存します。 PDF の読み取りと TXT ドキュメントの書き込みの両方で、完全修飾ファイル名を使用できます。出力 TXT コンテンツと形式は、元の PDF ドキュメントと同じになります。
pip install aspose-words
コピー
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document(Input.pdf)
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.txt")
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
builder.insert_image("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
shape = builder.insert_image("Input.pdf")
shape.get_shape_renderer().save("Output.txt", aw.saving.ImageSaveOptions(aw.SaveFormat.txt))
Python パッケージはPyPiリポジトリでホストしています。 "Aspose.Words for Python via .NET" 開発者環境にインストールする方法のステップバイステップの説明に従ってください。
このパッケージは Python ≥3.5 および <3.12 と互換性があります。 Linux 用のソフトウェアを開発する場合は、 製品ドキュメントの gcc および libpython の追加要件を参照してください。
PDFは他の多くのファイル形式に変換できます。