ใช้ไลบรารี Python via .NET เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ คุณสามารถรวมหน้า HTML ที่แยกออกมากับข้อมูลอื่น และทำให้ได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยก HTML ออกเป็นส่วนๆ ทำให้ทำงานร่วมกันในไฟล์ HTML ได้ง่ายขึ้น
ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา Python เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ การแยกไฟล์ HTML ออกเป็นไฟล์แยกกัน สามารถใช้เพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารแบบคู่ขนานกันได้ง่ายขึ้น ตัวอย่างเช่น หากมีคนหลายคนกำลังทำงานบน HTML หนึ่งรายการพร้อมกัน การแยก HTML จะช่วยให้พวกเขาทำงานได้เร็วขึ้น การแยก HTML อาจเป็นส่วนหนึ่งของเทคโนโลยีสำหรับการดึงข้อความจากไฟล์ HTML และการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล
ไลบรารีของเรามีฟังก์ชันที่จำเป็นทั้งหมดสำหรับนักพัฒนา Python เพื่อแยก HTML ออกเป็นส่วนๆ และแยกหน้าตามโหมดที่ระบุ นี่เป็นโซลูชัน Python via .NET แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ
แยกเนื้อหา HTML โดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Python คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้สำหรับไฟล์ HTML: 'แยกตามส่วนหัว', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'
หลังจากแยกไฟล์ HTML ออกเป็นส่วนๆ แล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วน HTML เป็น HTML หรือ EPUB โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้
แยกเอกสาร HTML อย่างง่ายดายด้วยโซลูชันของเราสำหรับ Python via .NET ตัวอย่างต่อไปนี้แสดงวิธีแยก HTML โดยใช้ Python:
pip install aspose-words
สำเนา
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
เราโฮสต์ Python ของเราในที่เก็บ PyPi โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้ง "Aspose.Words for Python via .NET" ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ
แพ็คเกจนี้เข้ากันได้กับ Python ≥3.5 และ <3.12 หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux โปรดดูข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython ใน Product Documentation