מדוע לפצל פורמטים של קבצים ב Python?

פיצול מסמכים לחלקים מאפשר לך לטפל בקבצים נפרדים במקביל. התקן את ספריית Python כדי לפצל מסמכים באופן פרוגרמטי. הוסף הפניה לספרייה (ייבא את הספרייה) לפרויקט Python שלך. פתח את מסמך המקור ב Python. קרא לשיטת extract_pages() כדי לחלץ דפים ספציפיים מהמסמך שלך. קבל את התוצאה של פיצול מסמכים כקבצים נפרדים.

אילו פורמטים של קבצים אוכל לפצל עם ספריית Python שלך?

אתה יכול לפצל את מסמכי המקור לחלקים ולשמור אותם במגוון רחב של פורמטים של קבצים: DOCX, PDF, ODT, DOC, HTML, RTF, Markdown,WPS, TXT ועוד רבים.

מהו גודל הקובץ המקסימלי הנתמך על ידי ספריית Python via .NET זו?

אין מגבלות גודל לפיצול קבצים באמצעות ספריית Python via .NET זו.

פיצול מסמכי Word, PDF, HTML לקבצים נפרדים ב Python

פיצול מסמכים לחלקים ב Python

ספריית Python מהירה לפיצול מסמך לקבוצה של קבצים קטנים יותר בהתאם לקריטריונים הנתונים

השתמש בספריית Python כדי לפצל מסמכים לחלקים. אתה יכול לשלב את הדפים שחולצו עם נתונים אחרים, וכתוצאה מכך, לקבל מסמכים בצורה והתוכן שאתה צריך. פיצול מסמכים לחלקים מקל על שיתוף הפעולה עליהם.

פיצול וורד, PDF באמצעות Python

ספריית תוכנה זו מספקת Python סט פונקציות לפיצול מסמכי Word, PDF, EPUB, HTML, DOCX לחלקים. ניתן להשתמש בפיצול טקסט לקבצים נפרדים כדי להקל על העבודה עם קטעי מסמכים. הליך פיצול מסמכים יכול להיות חלק מהטכנולוגיה לשילוב נתונים במערכות מידע או מסדי נתונים אוטומטיים.

הספרייה שלנו מספקת Python את כל הפונקציות הדרושות למסמכים ולחילוץ דפי מסמכים בהתאם למצב שצוין. זהו פתרון Python via .NET עצמאי שאינו מצריך התקנה של Microsoft Word, Acrobat Reader או יישומים אחרים.

פיצול מסמך לחלקים באמצעות Python

פיצול תוכן מסמך באמצעות קריטריונים שונים בקוד Python. אתה יכול להשתמש במצבי חילוץ הדפים הבאים: 'פיצול לפי כותרות', 'פיצול לפי מקטעים', 'פיצול עמוד אחר עמוד', 'פיצול לפי טווחי דפים'.

לאחר פיצול המסמך, תוכל לייצא את התוצאה לפורמט הקובץ הנדרש בשיטת 'Document.Save'. אתה יכול גם לשלוט על אופן ייצוא חלקי המסמכים לפורמטים של HTML או EPUB באמצעות המאפיין 'DocumentPartSavingCallback', שיאפשר לך להפנות מחדש זרמי פלט.

פיצול מסמכים בקלות עם הפתרון שלנו עבור Python via .NET. הדוגמה הבאה מראה כיצד לפצל מסמך באמצעות Python:

דוגמה לקוד ב Python כדי לפצל מסמך לחלקים

קובץ קלט

העלה קובץ שברצונך לפצל

הפעל קוד

פורמט פלט

בחר את פורמט היעד מהרשימה

pip install aspose-words

עותק

import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
            
					הפעל קוד

אתה רשאי להעתיק קוד זה באופן חופשי ולהשתמש בו בכל מטרה רלוונטית

כיצד לפצל את Word, PDF, HTML ופורמטים אחרים של קבצים ב Python

התקן את ספריית Python כדי לפצל מסמכים באופן פרוגרמטי.
הוסף הפניה לספרייה (ייבא את הספרייה) לפרויקט Python שלך.
פתח את מסמך המקור ב Python.
קרא לשיטת extract_pages() כדי לחלץ דפים ספציפיים מהמסמך שלך.
קבל את התוצאה של פיצול מסמכים כקבצים נפרדים.

ספריית Python לפיצול קבצים

אנו מארחים את חבילות Python שלנו במאגרי PyPi. אנא עקוב אחר ההוראות שלב אחר שלב כיצד להתקין את "Aspose.Words for Python via .NET" בסביבת המפתחים שלך.

דרישות מערכת

חבילה זו תואמת ל- Python ≥3.5 ו <3.12. אם אתה מפתח תוכנה עבור לינוקס, אנא עיין בדרישות נוספות עבור gcc ו- libpython בתיעוד המוצר.