تقسیم HTML به قطعات در Python

کتابخانه سریع Python برای تقسیم یک فایل HTML به گروهی از فایل های کوچکتر بر اساس معیارهای داده شده

از کتابخانه Python via .NET برای تقسیم فایل‌های HTML به بخش‌ها استفاده کنید. می‌توانید صفحات استخراج‌شده HTML را با داده‌های دیگر ادغام کنید و در نتیجه، اسناد شکل و محتوای مورد نیاز خود را دریافت کنید. تقسیم HTML به بخش‌ها، همکاری در فایل‌های HTML را آسان‌تر می‌کند.

مشاهده قطعه کد

با استفاده از Python HTML

این کتابخانه نرم افزار مجموعه ای از توابع را برای توسعه دهندگان Python فراهم می کند تا فایل های HTML را به قطعات تقسیم کنند. از تقسیم یک HTML به فایل‌های جداگانه می‌توان برای آسان‌تر کردن کار موازی با بخش‌های یک سند استفاده کرد. به عنوان مثال، اگر چندین نفر به طور همزمان روی یک HTML کار می کنند، تقسیم HTML به آنها امکان می دهد سرعت کار را افزایش دهند. تقسیم HTML ممکن است بخشی از فناوری استخراج متن از فایل‌های HTML و ادغام داده‌ها در سیستم‌های اطلاعات خودکار یا پایگاه‌های داده باشد.

کتابخانه ما به توسعه دهندگان Python همه عملکردهای لازم را برای تقسیم HTML به قطعات و استخراج صفحات مطابق با حالت مشخص شده ارائه می دهد. این یک راه حل مستقل Python via .NET است که نیازی به نصب Microsoft Word، Acrobat Reader یا سایر برنامه ها ندارد.

یک فایل HTML را به قسمت هایی در کد Python

محتوای HTML را با استفاده از معیارهای مختلف در کد Python کنید. می توانید از حالت های استخراج صفحه زیر برای فایل های HTML استفاده کنید: 'تقسیم بر اساس سرفصل ها'، 'تقسیم بر اساس بخش ها'، 'تقسیم صفحه به صفحه'، 'تقسیم بر اساس محدوده صفحه'.

پس از تقسیم فایل HTML به قطعات، می توانید نتیجه را با استفاده از روش 'Document.Save' به فرمت فایل مورد نیاز صادر کنید. همچنین می‌توانید نحوه صادرات قطعات HTML به HTML یا EPUB را با استفاده از ویژگی 'DocumentPartSavingCallback' کنترل کنید، که به شما امکان می‌دهد جریان‌های خروجی را تغییر مسیر دهید.

اسناد HTML را با راه حل ما برای Python via .NET Model.Platform به راحتی تقسیم کنید. مثال زیر نحوه تقسیم HTML با استفاده از Python:

Python نمونه کد برای تقسیم یک فایل HTML
فایلی را که می خواهید تقسیم کنید آپلود کنید
کد را اجرا کنید
قالب مورد نظر را از لیست انتخاب کنید
pip install aspose-words
کپی 🀄
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
کد را اجرا کنید

چگونه جداسازی HTML Python

  1. کتابخانه Python را برای تقسیم کردن HTML فایل به صورت برنامه‌ریزی نصب کنید.
  2. یک مرجع کتابخانه (وارد کردن کتابخانه) به پروژه Python خود اضافه کنید.
  3. HTML را در Python باز کنید.
  4. برای استخراج صفحات خاص از HTML، روش extract_pages() را فراخوانی کنید.
  5. نتیجه تقسیم HTML را به عنوان فایل جداگانه دریافت کنید.

کتابخانه Python برای تقسیم اسناد HTML

ما بسته های Python خود را در مخازن PyPi میزبانی می کنیم. لطفاً دستورالعمل های گام به گام نحوه نصب "Aspose.Words for Python via .NET" در محیط توسعه دهنده خود دنبال کنید.

سیستم مورد نیاز

این بسته با Python ≥3.5 و <3.12 سازگار است. اگر نرم‌افزاری برای لینوکس توسعه می‌دهید، لطفاً به الزامات اضافی برای gcc و libpython در مستندات محصول نگاهی بیندازید.

سایر عملیات تقسیم HTML پشتیبانی می شود

همچنین می توانید HTML را به فرمت های فایل دیگر تقسیم کنید:

5%

در به‌روزرسانی‌های محصول Aspose مشترک شوید

خبرنامه ها و پیشنهادات ماهانه را مستقیماً به صندوق پستی خود تحویل بگیرید.

© Aspose Pty Ltd 2001-2024. تمامی حقوق محفوظ است.