Pisah HTML dadi bagean ing Python

Pustaka Python cepet kanggo misahake siji HTML file dadi klompok file sing luwih cilik miturut kriteria sing diwenehake

Gunakake perpustakaan Python via .NET kanggo pamisah HTML file dadi bagean. Sampeyan bisa nggabungake kaca HTML sing diekstrak karo data liyane lan, minangka asil, entuk dokumen saka formulir lan isi sing dibutuhake. Pisah HTML dadi bagean nggawe luwih gampang kolaborasi ing HTML file.

Ndeleng potongan kode

HTML nggunakake Python

Pustaka piranti lunak iki nyedhiyakake pangembang Python kanthi sakumpulan fungsi kanggo pamisah HTML file dadi bagean. Pemisahan HTML dadi file sing kapisah bisa digunakake kanggo nggampangake nggarap bagean saka dokumen kanthi paralel. Contone, yen sawetara wong nggarap siji HTML ing wektu sing padha, banjur HTML bakal ngidini dheweke nyepetake karya. Pemisahan HTML bisa dadi bagian saka teknologi kanggo ngekstrak teks saka HTML file lan nggabungake data menyang sistem informasi utawa basis data otomatis.

Pustaka kita nyedhiyakake pangembang Python kabeh fungsi sing dibutuhake kanggo pamisah HTML dadi bagean lan extract kaca miturut mode sing ditemtokake. Iki minangka solusi Python via .NET sing ora mbutuhake Microsoft Word, Acrobat Reader utawa aplikasi liyane sing diinstal.

Pisah HTML file dadi bagean ing Python kode

Pisah isi HTML nggunakake kritéria beda ing Python kode. Sampeyan bisa nggunakake mode ekstraksi kaca ing ngisor iki kanggo HTML file: 'dibagi miturut judhul', 'dibagi miturut bagean', 'dibagi kaca miturut kaca', 'dibagi miturut rentang kaca'.

Sawise misahake HTML file dadi bagean, sampeyan bisa ngekspor asil menyang format file sing dibutuhake nggunakake metode 'Document.Save'. Sampeyan uga bisa ngontrol carane bagean HTML diekspor menyang HTML utawa EPUB nggunakake properti 'DocumentPartSavingCallback', sing bakal ngidini sampeyan ngarahake aliran output.

Pisah HTML dokumen kanthi gampang nganggo solusi kanggo Python via .NET. Conto ing ngisor iki nuduhake carane pamisah HTML nggunakake Python:

Python conto kode kanggo pamisah HTML file.
Unggah file sing pengin dipérang
Kode roto
Pilih format target saka dhaptar
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Kode roto

Carane pamisah HTML ing Python

  1. Pasang perpustakaan Python kanggo pamisah HTML file kanthi terprogram.
  2. Tambah referensi perpustakaan (ngimpor perpustakaan) menyang proyek Python sampeyan.
  3. Bukak HTML ing Python.
  4. Telpon metode extract_pages() kanggo ngekstrak kaca tartamtu saka HTML.
  5. Entuk asil pamisah HTML minangka file sing kapisah.

Python perpustakaan kanggo pamisah HTML dokumen

Kita dadi tuan rumah paket Python ing repositori PyPi. Mangga tindakake langkah-langkah dening-instruksi carane nginstal "Aspose.Words for Python via .NET" kanggo lingkungan pangembang.

Requirements Sistem

Paket iki kompatibel karo Python ≥3.5 lan <3.12. Yen sampeyan ngembangake piranti lunak kanggo Linux, deleng syarat tambahan kanggo gcc lan libpython ing Dokumentasi Produk.

Operasi pamisah HTML liyane sing didhukung

Sampeyan uga bisa pamisah HTML menyang format file liyane:

5%

Langganan kanggo Aspose Update Product

Entuk buletin saben wulan lan tawaran langsung dikirim menyang kothak layang.

© Aspose Pty Ltd 2001-2024. Kabeh hak dilindhungi undhang-undhang.