แยก DOCX ออกเป็นส่วนๆ ใน Python

ไลบรารี Python ที่รวดเร็วเพื่อแบ่งไฟล์ DOCX ไฟล์ออกเป็นกลุ่มของไฟล์ที่เล็กกว่าตามเกณฑ์ที่กำหนด

ใช้ไลบรารี Python via .NET เพื่อแยกไฟล์ DOCX ออกเป็นส่วนๆ คุณสามารถรวมหน้า DOCX ที่แยกออกมากับข้อมูลอื่น และทำให้ได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยก DOCX ออกเป็นส่วนๆ ทำให้ทำงานร่วมกันในไฟล์ DOCX ได้ง่ายขึ้น

ดูข้อมูลโค้ด

แยก DOCX ใน Python

ไลบรารีซอฟต์แวร์นี้ช่วยให้นักพัฒนา Python มีชุดฟังก์ชันเพื่อแยกไฟล์ DOCX ออกเป็นส่วนๆ การแบ่งเอกสาร DOCX เป็นไฟล์แยกกันสามารถใช้เพื่อช่วยให้ทำงานกับส่วนต่างๆ ของเอกสารพร้อมกันได้ง่ายขึ้น ตัวอย่างเช่น หากมีคนทำงานกับเอกสาร DOCX ฉบับเดียวพร้อมกัน การแยกเอกสารจะช่วยให้ทำงานได้เร็วขึ้น การแยกเอกสาร DOCX อาจเป็นส่วนหนึ่งของเทคโนโลยีในการแยกข้อความจากไฟล์ DOCX และรวมข้อมูลเข้ากับระบบข้อมูลหรือฐานข้อมูลอัตโนมัติ

ไลบรารีของเรามอบฟังก์ชันที่จำเป็นทั้งหมดให้กับนักพัฒนา Python เพื่อแยกไฟล์ DOCX ออกเป็นส่วน ๆ และแยกหน้าตามโหมดที่ระบุ นี่เป็นโซลูชัน Python via .NET แบบสแตนด์อโลนที่ไม่จำเป็นต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่น ๆ

แยกเอกสาร DOCX ออกเป็นส่วน ๆ โดยใช้ Python

แยกเนื้อหา DOCX โดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Python คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้สำหรับเอกสาร DOCX: 'แบ่งตามส่วนหัว', 'แบ่งตามส่วน', 'แบ่งหน้าทีละหน้า', 'แบ่งตามช่วงหน้า'

หลังจากแยกไฟล์ DOCX ออกเป็นส่วนๆ แล้ว คุณสามารถส่งออกผลลัพธ์เป็นรูปแบบไฟล์ที่ต้องการได้โดยใช้เมธอด 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วนของเอกสาร DOCX ไปยัง HTML หรือ EPUB ได้โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะช่วยให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้

แยกเอกสาร DOCX ได้อย่างง่ายดายด้วยโซลูชันของเราสำหรับ Python via .NET ตัวอย่างต่อไปนี้แสดงวิธีแยกเอกสาร DOCX โดยใช้ Python:

Python ตัวอย่างโค้ดเพื่อแบ่ง DOCX file
อัปโหลดไฟล์ที่คุณต้องการแยก
รันโค้ด
เลือกรูปแบบเป้าหมายจากรายการ
pip install aspose-words
สำเนา
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
รันโค้ด

วิธีแยก DOCX ใน Python

  1. ติดตั้งไลบรารี Python เพื่อแยกไฟล์ DOCX ไฟล์โดยทางโปรแกรม
  2. เพิ่มการอ้างอิงไลบรารี (นำเข้าไลบรารี) ไปยังโปรเจ็กต์ Python ของคุณ
  3. เปิด DOCX ใน Python
  4. เรียกเมธอด extract_pages() เพื่อดึงข้อมูลบางหน้าออกจาก DOCX
  5. รับผลลัพธ์จากการแยก DOCX เป็นไฟล์แยกกัน

Python ห้องสมุดเพื่อแยก DOCX เอกสาร

เราโฮสต์ Python ของเราในที่เก็บ PyPi โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้ง "Aspose.Words for Python via .NET" ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ

ความต้องการของระบบ

แพ็คเกจนี้เข้ากันได้กับ Python ≥3.5 และ <3.12 หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux โปรดดูข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython ใน Product Documentation

การดำเนินการแยกอื่นๆ ที่รองรับ DOCX

คุณยังสามารถแบ่ง DOCX เป็นรูปแบบไฟล์อื่นได้:

5%

สมัครสมาชิก Aspose Product Updates

รับจดหมายข่าวและข้อเสนอรายเดือนที่ส่งตรงถึงกล่องจดหมายของคุณ