Pisahkan dokumen kepada bahagian dalam Python

Pustaka Python pantas untuk membahagikan dokumen kepada kumpulan fail yang lebih kecil mengikut kriteria yang diberikan

Gunakan pustaka Python untuk membahagikan dokumen kepada beberapa bahagian. Anda boleh menyepadukan halaman yang diekstrak dengan data lain dan, sebagai hasilnya, dapatkan dokumen borang dan kandungan yang anda perlukan. Membahagikan dokumen kepada beberapa bahagian memudahkan untuk bekerjasama padanya.

Lihat coretan kod

Split Word, PDF menggunakan Python

Pustaka perisian ini menyediakan pembangun Python dengan satu set fungsi untuk memisahkan Word dokumen, PDF, EPUB, HTML, DOCX kepada beberapa bahagian. Memisahkan teks kepada fail berasingan boleh digunakan untuk memudahkan kerja dengan bahagian dokumen. Prosedur pemisahan dokumen boleh menjadi sebahagian daripada teknologi untuk menyepadukan data ke dalam sistem maklumat automatik atau pangkalan data.

Pustaka kami menyediakan pembangun Python dengan semua fungsi yang diperlukan untuk dokumen dan mengekstrak halaman dokumen mengikut mod yang ditentukan. Ini adalah penyelesaian Python via .NET yang berdiri sendiri yang tidak memerlukan Microsoft Word, Acrobat Reader atau aplikasi lain dipasang.

Pisahkan dokumen kepada bahagian menggunakan Python

Pisahkan kandungan dokumen menggunakan kriteria berbeza dalam Python kod. Anda boleh menggunakan mod pengekstrakan halaman berikut: 'dipecah mengikut tajuk', 'dipecah mengikut bahagian', 'dipisahkan halaman dengan halaman', 'dipisahkan mengikut julat halaman'.

Selepas membelah dokumen, anda boleh mengeksport hasil ke format fail yang diperlukan menggunakan kaedah 'Document.Save'. Anda juga boleh mengawal cara bahagian dokumen dieksport ke HTML format atau EPUB menggunakan sifat 'DocumentPartSavingCallback', yang akan membolehkan anda mengubah hala strim output.

Pisahkan dokumen dengan mudah dengan penyelesaian kami untuk Python via .NET. Contoh berikut menunjukkan cara membahagikan dokumen menggunakan Python:

Contoh kod dalam Python untuk membahagikan dokumen kepada beberapa bahagian
Muat naik fail yang anda ingin belah
Jalankan kod
Pilih format sasaran daripada senarai
pip install aspose-words
Salinan
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Jalankan kod

Cara memisahkan Word, PDF, HTML dan format fail lain dalam Python

  1. Pasang pustaka Python untuk memisahkan dokumen secara pemrograman.
  2. Tambahkan rujukan perpustakaan (import pustaka) ke projek Python anda.
  3. Buka dokumen sumber dalam Python.
  4. Panggil kaedah extract_pages() untuk mengekstrak halaman tertentu daripada dokumen anda.
  5. Dapatkan hasil pemisahan dokumen sebagai fail berasingan.

Python perpustakaan untuk memisahkan fail

Kami menjadi tuan rumah pakej Python kami dalam repositori PyPi. Sila ikut arahan langkah demi langkah tentang cara memasang "Aspose.Words for Python via .NET" ke persekitaran pembangun anda.

Keperluan Sistem

Pakej ini serasi dengan Python ≥3.5 dan <3.12. Jika anda membangunkan perisian untuk Linux, sila lihat keperluan tambahan untuk gcc dan libpython dalam Dokumentasi Produk.

Format fail paling popular untuk pemisahan

5%

Langgan Kemas Kini Produk Aspose

Dapatkan surat berita bulanan dan tawaran yang dihantar terus ke peti mel anda.

© Aspose Pty Ltd 2001-2024. Hak cipta terpelihara.