แยก HTML ออกเป็นส่วนๆ ใน Python

ไลบรารี Python ที่รวดเร็วเพื่อแบ่งไฟล์ HTML ไฟล์ออกเป็นกลุ่มของไฟล์ที่เล็กกว่าตามเกณฑ์ที่กำหนด

ใช้ไลบรารี Python via .NET เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ คุณสามารถรวมหน้า HTML ที่แยกออกมากับข้อมูลอื่น และทำให้ได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยก HTML ออกเป็นส่วนๆ ทำให้ทำงานร่วมกันในไฟล์ HTML ได้ง่ายขึ้น

ดูข้อมูลโค้ด

แยก HTML โดยใช้ Python

ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา Python เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ การแยกไฟล์ HTML ออกเป็นไฟล์แยกกัน สามารถใช้เพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารแบบคู่ขนานกันได้ง่ายขึ้น ตัวอย่างเช่น หากมีคนหลายคนกำลังทำงานบน HTML หนึ่งรายการพร้อมกัน การแยก HTML จะช่วยให้พวกเขาทำงานได้เร็วขึ้น การแยก HTML อาจเป็นส่วนหนึ่งของเทคโนโลยีสำหรับการดึงข้อความจากไฟล์ HTML และการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล

ไลบรารีของเรามีฟังก์ชันที่จำเป็นทั้งหมดสำหรับนักพัฒนา Python เพื่อแยก HTML ออกเป็นส่วนๆ และแยกหน้าตามโหมดที่ระบุ นี่เป็นโซลูชัน Python via .NET แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ

แยกไฟล์ HTML ออกเป็นส่วนๆ ในโค้ด Python

แยกเนื้อหา HTML โดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Python คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้สำหรับไฟล์ HTML: 'แยกตามส่วนหัว', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'

หลังจากแยกไฟล์ HTML ออกเป็นส่วนๆ แล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วน HTML เป็น HTML หรือ EPUB โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้

แยกเอกสาร HTML อย่างง่ายดายด้วยโซลูชันของเราสำหรับ Python via .NET ตัวอย่างต่อไปนี้แสดงวิธีแยก HTML โดยใช้ Python:

Python ตัวอย่างโค้ดเพื่อแบ่ง HTML file
อัปโหลดไฟล์ที่คุณต้องการแยก
รันโค้ด
เลือกรูปแบบเป้าหมายจากรายการ
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
รันโค้ด

วิธีแยก HTML ใน Python

  1. ติดตั้งไลบรารี Python เพื่อแยกไฟล์ HTML ไฟล์โดยทางโปรแกรม
  2. เพิ่มการอ้างอิงไลบรารี (นำเข้าไลบรารี) ไปยังโปรเจ็กต์ Python ของคุณ
  3. เปิด HTML ใน Python
  4. เรียกเมธอด extract_pages() เพื่อดึงข้อมูลบางหน้าออกจาก HTML
  5. รับผลลัพธ์จากการแยก HTML เป็นไฟล์แยกกัน

Python ห้องสมุดเพื่อแยก HTML เอกสาร

เราโฮสต์ Python ของเราในที่เก็บ PyPi โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้ง "Aspose.Words for Python via .NET" ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ

ความต้องการของระบบ

แพ็คเกจนี้เข้ากันได้กับ Python ≥3.5 และ <3.12 หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux โปรดดูข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython ใน Product Documentation

การดำเนินการแยกอื่นๆ ที่รองรับ HTML

คุณยังสามารถแบ่ง HTML เป็นรูปแบบไฟล์อื่นได้:

5%

สมัครสมาชิก Aspose Product Updates

รับจดหมายข่าวและข้อเสนอรายเดือนที่ส่งตรงถึงกล่องจดหมายของคุณ