השתמש בספריית Python כדי לפצל מסמכים לחלקים. אתה יכול לשלב את הדפים שחולצו עם נתונים אחרים, וכתוצאה מכך, לקבל מסמכים בצורה והתוכן שאתה צריך. פיצול מסמכים לחלקים מקל על שיתוף הפעולה עליהם.
ספריית תוכנה זו מספקת Python סט פונקציות לפיצול מסמכי Word, PDF, EPUB, HTML, DOCX לחלקים. ניתן להשתמש בפיצול טקסט לקבצים נפרדים כדי להקל על העבודה עם קטעי מסמכים. הליך פיצול מסמכים יכול להיות חלק מהטכנולוגיה לשילוב נתונים במערכות מידע או מסדי נתונים אוטומטיים.
הספרייה שלנו מספקת Python את כל הפונקציות הדרושות למסמכים ולחילוץ דפי מסמכים בהתאם למצב שצוין. זהו פתרון Python via .NET עצמאי שאינו מצריך התקנה של Microsoft Word, Acrobat Reader או יישומים אחרים.
פיצול תוכן מסמך באמצעות קריטריונים שונים בקוד Python. אתה יכול להשתמש במצבי חילוץ הדפים הבאים: 'פיצול לפי כותרות', 'פיצול לפי מקטעים', 'פיצול עמוד אחר עמוד', 'פיצול לפי טווחי דפים'.
לאחר פיצול המסמך, תוכל לייצא את התוצאה לפורמט הקובץ הנדרש בשיטת 'Document.Save'. אתה יכול גם לשלוט על אופן ייצוא חלקי המסמכים לפורמטים של HTML או EPUB באמצעות המאפיין 'DocumentPartSavingCallback', שיאפשר לך להפנות מחדש זרמי פלט.
פיצול מסמכים בקלות עם הפתרון שלנו עבור Python via .NET. הדוגמה הבאה מראה כיצד לפצל מסמך באמצעות Python:
pip install aspose-words
עותק
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
אנו מארחים את חבילות Python שלנו במאגרי PyPi. אנא עקוב אחר ההוראות שלב אחר שלב כיצד להתקין את "Aspose.Words for Python via .NET" בסביבת המפתחים שלך.
חבילה זו תואמת ל- Python ≥3.5 ו <3.12. אם אתה מפתח תוכנה עבור לינוקס, אנא עיין בדרישות נוספות עבור gcc ו- libpython בתיעוד המוצר.