Pisahkan HTML kepada bahagian dalam Python

Pustaka Python pantas untuk membahagikan satu HTML fail kepada kumpulan fail yang lebih kecil mengikut kriteria yang diberikan

Gunakan pustaka Python via .NET untuk membahagikan HTML fail kepada bahagian. Anda boleh menyepadukan HTML halaman yang diekstrak dengan data lain dan, sebagai hasilnya, mendapatkan dokumen borang dan kandungan yang anda perlukan. Membahagikan HTML kepada bahagian menjadikannya lebih mudah untuk bekerjasama pada HTML fail.

Lihat coretan kod

Pisahkan HTML menggunakan Python

Pustaka perisian ini menyediakan pembangun Python satu set fungsi untuk memisahkan HTML fail kepada beberapa bahagian. Memisahkan HTML ke dalam fail berasingan boleh digunakan untuk memudahkan kerja dengan bahagian dokumen secara selari. Contohnya, jika beberapa orang sedang mengerjakan satu HTML pada masa yang sama, maka memisahkan HTML akan membolehkan mereka mempercepatkan kerja. Pemisahan HTML mungkin sebahagian daripada teknologi untuk mengekstrak teks daripada HTML fail dan menyepadukan data ke dalam sistem maklumat automatik atau pangkalan data.

Pustaka kami menyediakan pembangun Python dengan semua fungsi yang diperlukan untuk memisahkan HTML kepada bahagian dan mengekstrak halaman mengikut mod yang ditentukan. Ini adalah penyelesaian Python via .NET yang berdiri sendiri yang tidak memerlukan Microsoft Word, Acrobat Reader atau aplikasi lain dipasang.

Pisahkan HTML fail kepada bahagian dalam Python kod

Pisahkan kandungan HTML menggunakan kriteria berbeza dalam Python kod. Anda boleh menggunakan mod pengekstrakan halaman berikut untuk HTML fail: 'dipisahkan mengikut tajuk', 'dipisahkan mengikut bahagian', 'dipisahkan halaman dengan halaman', 'dipisahkan mengikut julat halaman'.

Selepas membahagikan fail anda HTML kepada beberapa bahagian, anda boleh mengeksport hasilnya ke format fail yang diperlukan menggunakan kaedah 'Document.Save'. Anda juga boleh mengawal cara bahagian HTML dieksport ke HTML atau EPUB menggunakan sifat 'DocumentPartSavingCallback', yang membolehkan anda mengubah hala strim output.

Pisahkan HTML dokumen dengan mudah dengan penyelesaian kami untuk Python via .NET. Contoh berikut menunjukkan cara memisahkan HTML menggunakan Python:

Python contoh kod untuk membelah HTML fail.
Muat naik fail yang anda ingin belah
Jalankan kod
Pilih format sasaran daripada senarai
pip install aspose-words
Salinan
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Jalankan kod

Cara membahagikan HTML dalam Python

  1. Pasang pustaka Python untuk membahagi HTML fail secara pengaturcaraan.
  2. Tambahkan rujukan perpustakaan (import pustaka) ke projek Python anda.
  3. Buka HTML dalam Python.
  4. Panggil kaedah extract_pages() untuk mengekstrak halaman tertentu daripada HTML.
  5. Dapatkan hasil pemisahan HTML sebagai fail berasingan.

Python perpustakaan untuk memisahkan HTML dokumen

Kami menjadi tuan rumah pakej Python kami dalam repositori PyPi. Sila ikut arahan langkah demi langkah tentang cara memasang "Aspose.Words for Python via .NET" ke persekitaran pembangun anda.

Keperluan Sistem

Pakej ini serasi dengan Python ≥3.5 dan <3.12. Jika anda membangunkan perisian untuk Linux, sila lihat keperluan tambahan untuk gcc dan libpython dalam Dokumentasi Produk.

Operasi pisah HTML lain yang disokong

Anda juga boleh memisahkan HTML kepada format fail lain:

5%

Langgan Kemas Kini Produk Aspose

Dapatkan surat berita bulanan dan tawaran yang dihantar terus ke peti mel anda.

© Aspose Pty Ltd 2001-2024. Hak cipta terpelihara.