Gunakan pustaka Python via .NET untuk membahagikan HTML fail kepada bahagian. Anda boleh menyepadukan HTML halaman yang diekstrak dengan data lain dan, sebagai hasilnya, mendapatkan dokumen borang dan kandungan yang anda perlukan. Membahagikan HTML kepada bahagian menjadikannya lebih mudah untuk bekerjasama pada HTML fail.
Pustaka perisian ini menyediakan pembangun Python satu set fungsi untuk memisahkan HTML fail kepada beberapa bahagian. Memisahkan HTML ke dalam fail berasingan boleh digunakan untuk memudahkan kerja dengan bahagian dokumen secara selari. Contohnya, jika beberapa orang sedang mengerjakan satu HTML pada masa yang sama, maka memisahkan HTML akan membolehkan mereka mempercepatkan kerja. Pemisahan HTML mungkin sebahagian daripada teknologi untuk mengekstrak teks daripada HTML fail dan menyepadukan data ke dalam sistem maklumat automatik atau pangkalan data.
Pustaka kami menyediakan pembangun Python dengan semua fungsi yang diperlukan untuk memisahkan HTML kepada bahagian dan mengekstrak halaman mengikut mod yang ditentukan. Ini adalah penyelesaian Python via .NET yang berdiri sendiri yang tidak memerlukan Microsoft Word, Acrobat Reader atau aplikasi lain dipasang.
Pisahkan kandungan HTML menggunakan kriteria berbeza dalam Python kod. Anda boleh menggunakan mod pengekstrakan halaman berikut untuk HTML fail: 'dipisahkan mengikut tajuk', 'dipisahkan mengikut bahagian', 'dipisahkan halaman dengan halaman', 'dipisahkan mengikut julat halaman'.
Selepas membahagikan fail anda HTML kepada beberapa bahagian, anda boleh mengeksport hasilnya ke format fail yang diperlukan menggunakan kaedah 'Document.Save'. Anda juga boleh mengawal cara bahagian HTML dieksport ke HTML atau EPUB menggunakan sifat 'DocumentPartSavingCallback', yang membolehkan anda mengubah hala strim output.
Pisahkan HTML dokumen dengan mudah dengan penyelesaian kami untuk Python via .NET. Contoh berikut menunjukkan cara memisahkan HTML menggunakan Python:
pip install aspose-words
Salinan
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Kami menjadi tuan rumah pakej Python kami dalam repositori PyPi. Sila ikut arahan langkah demi langkah tentang cara memasang "Aspose.Words for Python via .NET" ke persekitaran pembangun anda.
Pakej ini serasi dengan Python ≥3.5 dan <3.12. Jika anda membangunkan perisian untuk Linux, sila lihat keperluan tambahan untuk gcc dan libpython dalam Dokumentasi Produk.