تقسیم اسناد به قطعات در Python

کتابخانه Python سریع برای تقسیم یک سند به گروهی از فایل های کوچکتر بر اساس معیارهای داده شده

از کتابخانه Python برای تقسیم اسناد به قطعات استفاده کنید. می توانید صفحات استخراج شده را با داده های دیگر ادغام کنید و در نتیجه اسنادی از فرم و محتوای مورد نیاز خود را دریافت کنید. تقسیم اسناد به قطعات، همکاری روی آنها را آسان تر می کند.

مشاهده قطعه کد

با استفاده از Python، Word، PDF را تقسیم کنید

این کتابخانه نرم افزار مجموعه ای از توابع را در اختیار توسعه دهندگان Python قرار می دهد تا اسناد Word، PDF، EPUB، HTML، DOCX را به قطعات تقسیم کنند. برای سهولت کار با بخش هایی از اسناد، می توان از تقسیم متن به فایل های جداگانه استفاده کرد. روش تقسیم اسناد می تواند بخشی از فناوری یکپارچه سازی داده ها در سیستم های اطلاعاتی خودکار یا پایگاه های داده باشد.

کتابخانه ما به توسعه دهندگان Python همه عملکردهای لازم برای اسناد و استخراج صفحات سند مطابق با حالت مشخص شده را ارائه می دهد. این یک راه حل مستقل Python via .NET است که نیازی به نصب Microsoft Word، Acrobat Reader یا سایر برنامه ها ندارد.

با استفاده از Python یک سند را به قطعات تقسیم کنید

محتوای سند را با معیارهای مختلف در کد Python کنید. می‌توانید از حالت‌های استخراج صفحه زیر استفاده کنید: 'تقسیم بر اساس عنوان'، 'تقسیم بر اساس بخش'، 'تقسیم صفحه به صفحه'، 'تقسیم بر اساس محدوده‌های صفحه'.

پس از تقسیم سند، می توانید نتیجه را با استفاده از روش 'Document.Save' به فرمت فایل مورد نیاز صادر کنید. همچنین می‌توانید نحوه صادرات قطعات سند به فرمت‌های HTML یا EPUB را با استفاده از ویژگی 'DocumentPartSavingCallback' کنترل کنید، که به شما امکان می‌دهد جریان‌های خروجی را تغییر مسیر دهید.

اسناد را به راحتی با راه حل ما برای Python via .NET کنید. مثال زیر نحوه تقسیم یک سند با استفاده از Python:

مثال کد در Python برای تقسیم یک سند به بخش
فایلی را که می خواهید تقسیم کنید آپلود کنید
کد را اجرا کنید
قالب مورد نظر را از لیست انتخاب کنید
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
کد را اجرا کنید

نحوه تقسیم Word، PDF، HTML و سایر فرمت های فایل در Python

  1. کتابخانه Python را نصب کنید تا اسناد را به صورت برنامه ای تقسیم کنید.
  2. یک مرجع کتابخانه (وارد کردن کتابخانه) به پروژه Python خود اضافه کنید.
  3. سند منبع را در Python باز کنید.
  4. برای استخراج صفحات خاص از سند خود، متد extract_pages()() را فراخوانی کنید.
  5. نتیجه تقسیم سند را به صورت فایل های جداگانه دریافت کنید.

کتابخانه Python برای تقسیم فایل ها

ما بسته های Python خود را در مخازن PyPi میزبانی می کنیم. لطفاً دستورالعمل های گام به گام نحوه نصب "Aspose.Words for Python via .NET" در محیط توسعه دهنده خود دنبال کنید.

سیستم مورد نیاز

این بسته با Python ≥3.5 و <3.12 سازگار است. اگر نرم‌افزاری برای لینوکس توسعه می‌دهید، لطفاً به الزامات اضافی برای gcc و libpython در مستندات محصول نگاهی بیندازید.

محبوب ترین فرمت های فایل برای تقسیم

5%

در به‌روزرسانی‌های محصول Aspose مشترک شوید

خبرنامه ها و پیشنهادات ماهانه را مستقیماً به صندوق پستی خود تحویل بگیرید.

© Aspose Pty Ltd 2001-2024. تمامی حقوق محفوظ است.