از کتابخانه Python via .NET برای تقسیم فایلهای HTML به بخشها استفاده کنید. میتوانید صفحات استخراجشده HTML را با دادههای دیگر ادغام کنید و در نتیجه، اسناد شکل و محتوای مورد نیاز خود را دریافت کنید. تقسیم HTML به بخشها، همکاری در فایلهای HTML را آسانتر میکند.
این کتابخانه نرم افزار مجموعه ای از توابع را برای توسعه دهندگان Python فراهم می کند تا فایل های HTML را به قطعات تقسیم کنند. از تقسیم یک HTML به فایلهای جداگانه میتوان برای آسانتر کردن کار موازی با بخشهای یک سند استفاده کرد. به عنوان مثال، اگر چندین نفر به طور همزمان روی یک HTML کار می کنند، تقسیم HTML به آنها امکان می دهد سرعت کار را افزایش دهند. تقسیم HTML ممکن است بخشی از فناوری استخراج متن از فایلهای HTML و ادغام دادهها در سیستمهای اطلاعات خودکار یا پایگاههای داده باشد.
کتابخانه ما به توسعه دهندگان Python همه عملکردهای لازم را برای تقسیم HTML به قطعات و استخراج صفحات مطابق با حالت مشخص شده ارائه می دهد. این یک راه حل مستقل Python via .NET است که نیازی به نصب Microsoft Word، Acrobat Reader یا سایر برنامه ها ندارد.
محتوای HTML را با استفاده از معیارهای مختلف در کد Python کنید. می توانید از حالت های استخراج صفحه زیر برای فایل های HTML استفاده کنید: 'تقسیم بر اساس سرفصل ها'، 'تقسیم بر اساس بخش ها'، 'تقسیم صفحه به صفحه'، 'تقسیم بر اساس محدوده صفحه'.
پس از تقسیم فایل HTML به قطعات، می توانید نتیجه را با استفاده از روش 'Document.Save' به فرمت فایل مورد نیاز صادر کنید. همچنین میتوانید نحوه صادرات قطعات HTML به HTML یا EPUB را با استفاده از ویژگی 'DocumentPartSavingCallback' کنترل کنید، که به شما امکان میدهد جریانهای خروجی را تغییر مسیر دهید.
اسناد HTML را با راه حل ما برای Python via .NET Model.Platform به راحتی تقسیم کنید. مثال زیر نحوه تقسیم HTML با استفاده از Python:
pip install aspose-words
کپی 🀄
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
ما بسته های Python خود را در مخازن PyPi میزبانی می کنیم. لطفاً دستورالعمل های گام به گام نحوه نصب "Aspose.Words for Python via .NET" در محیط توسعه دهنده خود دنبال کنید.
این بسته با Python ≥3.5 و <3.12 سازگار است. اگر نرمافزاری برای لینوکس توسعه میدهید، لطفاً به الزامات اضافی برای gcc و libpython در مستندات محصول نگاهی بیندازید.