ใช้ไลบรารี Python via .NET เพื่อแยกไฟล์ DOCX ออกเป็นส่วนๆ คุณสามารถรวมหน้า DOCX ที่แยกออกมากับข้อมูลอื่น และทำให้ได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยก DOCX ออกเป็นส่วนๆ ทำให้ทำงานร่วมกันในไฟล์ DOCX ได้ง่ายขึ้น
ไลบรารีซอฟต์แวร์นี้ช่วยให้นักพัฒนา Python มีชุดฟังก์ชันเพื่อแยกไฟล์ DOCX ออกเป็นส่วนๆ การแบ่งเอกสาร DOCX เป็นไฟล์แยกกันสามารถใช้เพื่อช่วยให้ทำงานกับส่วนต่างๆ ของเอกสารพร้อมกันได้ง่ายขึ้น ตัวอย่างเช่น หากมีคนทำงานกับเอกสาร DOCX ฉบับเดียวพร้อมกัน การแยกเอกสารจะช่วยให้ทำงานได้เร็วขึ้น การแยกเอกสาร DOCX อาจเป็นส่วนหนึ่งของเทคโนโลยีในการแยกข้อความจากไฟล์ DOCX และรวมข้อมูลเข้ากับระบบข้อมูลหรือฐานข้อมูลอัตโนมัติ
ไลบรารีของเรามอบฟังก์ชันที่จำเป็นทั้งหมดให้กับนักพัฒนา Python เพื่อแยกไฟล์ DOCX ออกเป็นส่วน ๆ และแยกหน้าตามโหมดที่ระบุ นี่เป็นโซลูชัน Python via .NET แบบสแตนด์อโลนที่ไม่จำเป็นต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่น ๆ
แยกเนื้อหา DOCX โดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Python คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้สำหรับเอกสาร DOCX: 'แบ่งตามส่วนหัว', 'แบ่งตามส่วน', 'แบ่งหน้าทีละหน้า', 'แบ่งตามช่วงหน้า'
หลังจากแยกไฟล์ DOCX ออกเป็นส่วนๆ แล้ว คุณสามารถส่งออกผลลัพธ์เป็นรูปแบบไฟล์ที่ต้องการได้โดยใช้เมธอด 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วนของเอกสาร DOCX ไปยัง HTML หรือ EPUB ได้โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะช่วยให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้
แยกเอกสาร DOCX ได้อย่างง่ายดายด้วยโซลูชันของเราสำหรับ Python via .NET ตัวอย่างต่อไปนี้แสดงวิธีแยกเอกสาร DOCX โดยใช้ Python:
pip install aspose-words
สำเนา
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
เราโฮสต์ Python ของเราในที่เก็บ PyPi โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้ง "Aspose.Words for Python via .NET" ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ
แพ็คเกจนี้เข้ากันได้กับ Python ≥3.5 และ <3.12 หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux โปรดดูข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython ใน Product Documentation