Pisahake dokumen dadi bagean ing Python

Pustaka Python cepet kanggo misahake dokumen dadi klompok file sing luwih cilik miturut kriteria sing diwenehake

Gunakake perpustakaan Python kanggo misahake dokumen dadi bagean. Sampeyan bisa nggabungake kaca sing diekstrak karo data liyane lan, minangka asil, entuk dokumen saka formulir lan konten sing dibutuhake. Pamisahan dokumen dadi bagean nggawe luwih gampang kanggo kolaborasi.

Ndeleng potongan kode

Pisah Tembung, PDF nggunakake Python

Pustaka piranti lunak iki nyedhiyakake pangembang Python kanthi sakumpulan fungsi kanggo pamisah Word dokumen, PDF, EPUB, HTML, DOCX dadi bagean. Pisah teks dadi file sing kapisah bisa digunakake kanggo nggampangake nggarap bagean dokumen. Prosedur pamisah dokumen bisa dadi bagéan saka teknologi kanggo nggabungake data menyang sistem informasi otomatis utawa database.

Pustaka kita nyedhiyakake pangembang Python kabeh fungsi sing dibutuhake kanggo dokumen lan ngekstrak kaca dokumen miturut mode sing ditemtokake. Iki minangka solusi Python via .NET sing ora mbutuhake Microsoft Word, Acrobat Reader utawa aplikasi liyane sing diinstal.

Pisahake dokumen dadi bagean nggunakake Python

Pisah isi dokumen nggunakake kritéria beda ing Python kode. Sampeyan bisa nggunakake mode ekstraksi kaca ing ngisor iki: 'dibagi miturut judhul', 'dibagi miturut bagean', 'dibagi kaca miturut kaca', 'dibagi miturut rentang kaca'.

Sawise misahake dokumen, sampeyan bisa ngekspor asil menyang format file sing dibutuhake nggunakake metode 'Document.Save'. Sampeyan uga bisa ngontrol carane bagean document diekspor menyang HTML utawa format EPUB nggunakake properti 'DocumentPartSavingCallback', sing bakal ngidini sampeyan pangalihan stream output.

Pisah dokumen kanthi gampang nganggo solusi kita kanggo Python via .NET. Conto ing ngisor iki nuduhake carane pamisah dokumen nggunakake Python:

Conto kode ing Python kanggo misahake dokumen dadi bagean
Unggah file sing pengin dipérang
Kode roto
Pilih format target saka dhaptar
pip install aspose-words
Nyalin
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Kode roto

Cara pamisah Word, PDF, HTML lan format file liyane ing Python

  1. Pasang perpustakaan Python kanggo pamisah dokumen kanthi program.
  2. Tambah referensi perpustakaan (ngimpor perpustakaan) menyang proyek Python sampeyan.
  3. Bukak dokumen sumber ing Python.
  4. Telpon cara extract_pages() kanggo ngekstrak kaca tartamtu saka dokumen sampeyan.
  5. Entuk asil pamisah dokumen minangka file sing kapisah.

Python perpustakaan kanggo pamisah file

Kita dadi tuan rumah paket Python ing repositori PyPi. Mangga tindakake langkah-langkah dening-instruksi carane nginstal "Aspose.Words for Python via .NET" kanggo lingkungan pangembang.

Requirements Sistem

Paket iki kompatibel karo Python ≥3.5 lan <3.12. Yen sampeyan ngembangake piranti lunak kanggo Linux, deleng syarat tambahan kanggo gcc lan libpython ing Dokumentasi Produk.

Format file sing paling populer kanggo pamisah

5%

Langganan kanggo Aspose Update Product

Entuk buletin saben wulan lan tawaran langsung dikirim menyang kothak layang.

© Aspose Pty Ltd 2001-2024. Kabeh hak dilindhungi undhang-undhang.