ใช้ไลบรารี Python เพื่อแบ่งเอกสารออกเป็นส่วนๆ คุณสามารถรวมหน้าที่แยกออกมากับข้อมูลอื่น ๆ และด้วยเหตุนี้ คุณจะได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยกเอกสารเป็นส่วนๆ ช่วยให้ทำงานร่วมกันได้ง่ายขึ้น
ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา Python เพื่อแยกเอกสาร Word, PDF, EPUB, HTML, DOCX ออกเป็นส่วนๆ สามารถใช้การแยกข้อความเป็นไฟล์แยกกันเพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารได้ง่ายขึ้น ขั้นตอนการแยกเอกสารสามารถเป็นส่วนหนึ่งของเทคโนโลยีในการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล
ไลบรารีของเราให้นักพัฒนา Python มีฟังก์ชันที่จำเป็นทั้งหมดสำหรับเอกสารและการแยกหน้าเอกสารตามโหมดที่ระบุ นี่เป็นโซลูชัน Python via .NET แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ
แยกเนื้อหาเอกสารโดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Python คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้: 'แยกตามหัวเรื่อง', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'
หลังจากแยกเอกสารแล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วนของเอกสารเป็นรูปแบบ HTML หรือ EPUB ได้โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้
แยกเอกสารอย่างง่ายดายด้วยโซลูชันของเราสำหรับ Python via .NET ตัวอย่างต่อไปนี้แสดงวิธีการแยกเอกสารโดยใช้ Python:
pip install aspose-words
สำเนา
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
เราโฮสต์ Python ของเราในที่เก็บ PyPi โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้ง "Aspose.Words for Python via .NET" ในสภาพแวดล้อมของนักพัฒนาซอฟต์แวร์ของคุณ
แพ็คเกจนี้เข้ากันได้กับ Python ≥3.5 และ <3.12 หากคุณพัฒนาซอฟต์แวร์สำหรับ Linux โปรดดูข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython ใน Product Documentation