แยกเอกสารออกเป็นส่วนๆ ใน Python

ไลบรารี Python ที่รวดเร็วเพื่อแบ่งเอกสารเป็นกลุ่มของไฟล์ที่มีขนาดเล็กกว่าตามเกณฑ์ที่กำหนด

ใช้ไลบรารี Python เพื่อแบ่งเอกสารออกเป็นส่วนๆ คุณสามารถรวมหน้าที่แยกออกมากับข้อมูลอื่น ๆ และด้วยเหตุนี้ คุณจะได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยกเอกสารเป็นส่วนๆ ช่วยให้ทำงานร่วมกันได้ง่ายขึ้น

ดูข้อมูลโค้ด

แยกไฟล์ PDF โดยใช้ Python

ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา Python เพื่อแยกเอกสาร Word, PDF, EPUB, HTML, DOCX ออกเป็นส่วนๆ สามารถใช้การแยกข้อความเป็นไฟล์แยกกันเพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารได้ง่ายขึ้น ขั้นตอนการแยกเอกสารสามารถเป็นส่วนหนึ่งของเทคโนโลยีในการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล

ไลบรารีของเราให้นักพัฒนา Python มีฟังก์ชันที่จำเป็นทั้งหมดสำหรับเอกสารและการแยกหน้าเอกสารตามโหมดที่ระบุ นี่เป็นโซลูชัน Python via .NET แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ

แบ่งเอกสารออกเป็นส่วนๆ โดยใช้ Python

แยกเนื้อหาเอกสารโดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Python คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้: 'แยกตามหัวเรื่อง', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'

หลังจากแยกเอกสารแล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วนของเอกสารเป็นรูปแบบ HTML หรือ EPUB ได้โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้

แยกเอกสารอย่างง่ายดายด้วยโซลูชันของเราสำหรับ Python via .NET ตัวอย่างต่อไปนี้แสดงวิธีการแยกเอกสารโดยใช้ Python:

ตัวอย่างโค้ดใน Python เพื่อแบ่งเอกสารออกเป็นส่วนๆ
อัปโหลดไฟล์ที่คุณต้องการแยก
รันโค้ด
เลือกรูปแบบเป้าหมายจากรายการ
pip install aspose-words
สำเนา
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
รันโค้ด

วิธีแยก Word, PDF, HTML และรูปแบบไฟล์อื่นๆ ใน Python

  1. ติดตั้งไลบรารี Python เพื่อแยกเอกสารโดยทางโปรแกรม
  2. เพิ่มการอ้างอิงไลบรารี (นำเข้าไลบรารี) ไปยังโปรเจ็กต์ Python ของคุณ
  3. เปิดเอกสารต้นทางใน Python
  4. เรียกเมธอด extract_pages() เพื่อดึงหน้าเฉพาะออกจากเอกสารของคุณ
  5. รับผลการแยกเอกสารเป็นไฟล์แยกกัน

Python ไลบรารี่เพื่อแยกไฟล์

เราโฮสต์ Python ของเราในที่เก็บ PyPi โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้ง "Aspose.Words for Python via .NET" ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ

ความต้องการของระบบ

แพ็คเกจนี้เข้ากันได้กับ Python ≥3.5 และ <3.12 หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux โปรดดูข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython ใน Product Documentation

รูปแบบไฟล์ที่นิยมใช้สำหรับการแตกไฟล์

5%

สมัครสมาชิก Aspose Product Updates

รับจดหมายข่าวและข้อเสนอรายเดือนที่ส่งตรงถึงกล่องจดหมายของคุณ