Mengapa membahagikan HTML kepada bahagian dalam Python?

Membahagi HTML kepada bahagian membolehkan anda mengerjakan bahagian dokumen secara bebas. Pasang pustaka Python untuk membahagi HTML fail secara pengaturcaraan. Tambahkan rujukan perpustakaan (import pustaka) ke projek Python anda. Buka HTML dalam Python. Panggil kaedah extract_pages() untuk mengekstrak halaman tertentu daripada HTML. Dapatkan hasil pemisahan HTML sebagai fail berasingan.

Dalam format fail apakah saya boleh menyimpan HTML halaman yang diekstrak?

Anda boleh membahagikan HTML fail sumber kepada beberapa bahagian dan menyimpannya kepada pelbagai jenis format fail: DOCX, PDF, ODT, DOC, HTML, RTF, Markdown, WPS, TXT dan banyak lagi.

Apakah saiz fail maksimum HTML yang disokong oleh pustaka Python via .NET ini?

Tiada had saiz untuk membahagi HTML fail menggunakan pustaka Python via .NET ini.

Pisahkan HTML Kepada Bahagian Python

Pisahkan HTML kepada bahagian dalam Python

Pustaka Python pantas untuk membahagikan satu HTML fail kepada kumpulan fail yang lebih kecil mengikut kriteria yang diberikan

Gunakan pustaka Python via .NET untuk membahagikan HTML fail kepada bahagian. Anda boleh menyepadukan HTML halaman yang diekstrak dengan data lain dan, sebagai hasilnya, mendapatkan dokumen borang dan kandungan yang anda perlukan. Membahagikan HTML kepada bahagian menjadikannya lebih mudah untuk bekerjasama pada HTML fail.

Pisahkan HTML menggunakan Python

Pustaka perisian ini menyediakan pembangun Python satu set fungsi untuk memisahkan HTML fail kepada beberapa bahagian. Memisahkan HTML ke dalam fail berasingan boleh digunakan untuk memudahkan kerja dengan bahagian dokumen secara selari. Contohnya, jika beberapa orang sedang mengerjakan satu HTML pada masa yang sama, maka memisahkan HTML akan membolehkan mereka mempercepatkan kerja. Pemisahan HTML mungkin sebahagian daripada teknologi untuk mengekstrak teks daripada HTML fail dan menyepadukan data ke dalam sistem maklumat automatik atau pangkalan data.

Pustaka kami menyediakan pembangun Python dengan semua fungsi yang diperlukan untuk memisahkan HTML kepada bahagian dan mengekstrak halaman mengikut mod yang ditentukan. Ini adalah penyelesaian Python via .NET yang berdiri sendiri yang tidak memerlukan Microsoft Word, Acrobat Reader atau aplikasi lain dipasang.

Pisahkan HTML fail kepada bahagian dalam Python kod

Pisahkan kandungan HTML menggunakan kriteria berbeza dalam Python kod. Anda boleh menggunakan mod pengekstrakan halaman berikut untuk HTML fail: 'dipisahkan mengikut tajuk', 'dipisahkan mengikut bahagian', 'dipisahkan halaman dengan halaman', 'dipisahkan mengikut julat halaman'.

Selepas membahagikan fail anda HTML kepada beberapa bahagian, anda boleh mengeksport hasilnya ke format fail yang diperlukan menggunakan kaedah 'Document.Save'. Anda juga boleh mengawal cara bahagian HTML dieksport ke HTML atau EPUB menggunakan sifat 'DocumentPartSavingCallback', yang membolehkan anda mengubah hala strim output.

Pisahkan HTML dokumen dengan mudah dengan penyelesaian kami untuk Python via .NET. Contoh berikut menunjukkan cara memisahkan HTML menggunakan Python:

Python contoh kod untuk membelah HTML fail.

Fail input

Muat naik fail yang anda ingin belah

Jalankan kod

Format keluaran

Pilih format sasaran daripada senarai

pip install aspose-words

Salinan

import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
            
					Jalankan kod

Anda boleh menyalin kod ini secara bebas dan menggunakannya dalam sebarang tujuan yang berkenaan

Cara membahagikan HTML dalam Python

Pasang pustaka Python untuk membahagi HTML fail secara pengaturcaraan.
Tambahkan rujukan perpustakaan (import pustaka) ke projek Python anda.
Buka HTML dalam Python.
Panggil kaedah extract_pages() untuk mengekstrak halaman tertentu daripada HTML.
Dapatkan hasil pemisahan HTML sebagai fail berasingan.

Python perpustakaan untuk memisahkan HTML dokumen

Kami menjadi tuan rumah pakej Python kami dalam repositori PyPi. Sila ikut arahan langkah demi langkah tentang cara memasang "Aspose.Words for Python via .NET" ke persekitaran pembangun anda.

Keperluan Sistem

Pakej ini serasi dengan Python ≥3.5 dan <3.12. Jika anda membangunkan perisian untuk Linux, sila lihat keperluan tambahan untuk gcc dan libpython dalam Dokumentasi Produk.

Anda juga boleh memisahkan HTML kepada format fail lain: