このソフトウェア ライブラリは、Python 開発者に、DOCX ファイルを部分に分割する一連の関数を提供します。 DOCX ドキュメントを個別のファイルに分割すると、ドキュメントのセクションを並行して操作しやすくなります。たとえば、複数の人が 1 つの DOCX ドキュメントを同時に作業している場合、それを分割することで作業を高速化できます。 DOCX ドキュメントの分割は、DOCX ファイルからテキストを抽出し、データを自動化された情報システムまたはデータベースに統合するテクノロジーの一部である場合があります。
私たちのライブラリは、Python 開発者に、DOCX ファイルをパーツに分割し、指定されたモードに従ってページを抽出するために必要なすべての関数を提供します。これはスタンドアロンの Python via .NET ソリューションであり、Microsoft Word、Acrobat Reader、またはその他のアプリケーションをインストールする必要はありません。
Python コードで異なる基準を使用して DOCX コンテンツを分割します。 DOCX ドキュメントでは、「見出しごとに分割」、「セクションごとに分割」、「ページごとに分割」、「ページ範囲ごとに分割」のページ抽出モードを使用できます。
DOCX ファイルを部分に分割した後、「Document.Save」メソッドを使用して結果を必要なファイル形式にエクスポートできます。 「DocumentPartSavingCallback」プロパティを使用して、DOCX ドキュメント パーツを HTML または EPUB にエクスポートする方法を制御することもできます。これにより、出力ストリームをリダイレクトできます。
Python via .NET のソリューションを使用して、DOCX ドキュメントを簡単に分割します。次の例は、Python を使用して DOCX ドキュメントを分割する方法を示しています。
pip install aspose-words
コピー
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Python パッケージはPyPiリポジトリでホストしています。 "Aspose.Words for Python via .NET" 開発者環境にインストールする方法のステップバイステップの説明に従ってください。
このパッケージは Python ≥3.5 および <3.12 と互換性があります。 Linux 用のソフトウェアを開発する場合は、 製品ドキュメントの gcc および libpython の追加要件を参照してください。