השתמש בספריית Python via .NET כדי לפצל HTML קבצים לחלקים. אתה יכול לשלב את דפי ה HTML שחולצו עם נתונים אחרים, וכתוצאה מכך, לקבל מסמכים בצורת ובתוכן שאתה צריך. פיצול HTML לחלקים מקל על שיתוף הפעולה ב HTML קבצים.
ספריית תוכנה זו מספקת Python סט פונקציות לפיצול קבצים HTML לחלקים. ניתן להשתמש HTML לקבצים נפרדים כדי להקל על העבודה עם חלקים של מסמך במקביל. לדוגמה, אם מספר אנשים עובדים על HTML אחד בו-זמנית, אז פיצול HTML יאפשר להם להאיץ את העבודה. הפיצול HTML עשוי להיות חלק מטכנולוגיה לחילוץ טקסט מקבצים HTML ושילוב נתונים במערכות מידע או מסדי נתונים אוטומטיים.
הספרייה שלנו מספקת Python את כל הפונקציות הדרושות כדי לפצל את HTML לחלקים ולחלץ דפים בהתאם למצב שצוין. זהו פתרון Python via .NET עצמאי שאינו מצריך התקנה של Microsoft Word, Acrobat Reader או יישומים אחרים.
פיצול תוכן HTML באמצעות קריטריונים שונים בקוד Python. אתה יכול להשתמש במצבי חילוץ הדפים הבאים עבור קבצי HTML: 'פיצול לפי כותרות', 'פיצול לפי מקטעים', 'פיצול עמוד אחר עמוד', 'פיצול לפי טווחי דפים'.
לאחר פיצול הקובץ HTML לחלקים, תוכל לייצא את התוצאה לפורמט הקובץ הנדרש בשיטת 'Document.Save'. אתה יכול גם לשלוט על אופן ייצוא החלקים של HTML ל HTML או EPUB באמצעות המאפיין 'DocumentPartSavingCallback', שיאפשר לך להפנות מחדש זרמי פלט.
פיצול מסמכים HTML בקלות עם הפתרון שלנו עבור Python via .NET. הדוגמה הבאה מראה כיצד לפצל HTML באמצעות Python:
pip install aspose-words
עותק
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
אנו מארחים את חבילות Python שלנו במאגרי PyPi. אנא עקוב אחר ההוראות שלב אחר שלב כיצד להתקין את "Aspose.Words for Python via .NET" בסביבת המפתחים שלך.
חבילה זו תואמת ל- Python ≥3.5 ו <3.12. אם אתה מפתח תוכנה עבור לינוקס, אנא עיין בדרישות נוספות עבור gcc ו- libpython בתיעוד המוצר.