از کتابخانه Python برای تقسیم اسناد به قطعات استفاده کنید. می توانید صفحات استخراج شده را با داده های دیگر ادغام کنید و در نتیجه اسنادی از فرم و محتوای مورد نیاز خود را دریافت کنید. تقسیم اسناد به قطعات، همکاری روی آنها را آسان تر می کند.
این کتابخانه نرم افزار مجموعه ای از توابع را در اختیار توسعه دهندگان Python قرار می دهد تا اسناد Word، PDF، EPUB، HTML، DOCX را به قطعات تقسیم کنند. برای سهولت کار با بخش هایی از اسناد، می توان از تقسیم متن به فایل های جداگانه استفاده کرد. روش تقسیم اسناد می تواند بخشی از فناوری یکپارچه سازی داده ها در سیستم های اطلاعاتی خودکار یا پایگاه های داده باشد.
کتابخانه ما به توسعه دهندگان Python همه عملکردهای لازم برای اسناد و استخراج صفحات سند مطابق با حالت مشخص شده را ارائه می دهد. این یک راه حل مستقل Python via .NET است که نیازی به نصب Microsoft Word، Acrobat Reader یا سایر برنامه ها ندارد.
محتوای سند را با معیارهای مختلف در کد Python کنید. میتوانید از حالتهای استخراج صفحه زیر استفاده کنید: 'تقسیم بر اساس عنوان'، 'تقسیم بر اساس بخش'، 'تقسیم صفحه به صفحه'، 'تقسیم بر اساس محدودههای صفحه'.
پس از تقسیم سند، می توانید نتیجه را با استفاده از روش 'Document.Save' به فرمت فایل مورد نیاز صادر کنید. همچنین میتوانید نحوه صادرات قطعات سند به فرمتهای HTML یا EPUB را با استفاده از ویژگی 'DocumentPartSavingCallback' کنترل کنید، که به شما امکان میدهد جریانهای خروجی را تغییر مسیر دهید.
اسناد را به راحتی با راه حل ما برای Python via .NET کنید. مثال زیر نحوه تقسیم یک سند با استفاده از Python:
pip install aspose-words
کپی 🀄
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
ما بسته های Python خود را در مخازن PyPi میزبانی می کنیم. لطفاً دستورالعمل های گام به گام نحوه نصب "Aspose.Words for Python via .NET" در محیط توسعه دهنده خود دنبال کنید.
این بسته با Python ≥3.5 و <3.12 سازگار است. اگر نرمافزاری برای لینوکس توسعه میدهید، لطفاً به الزامات اضافی برای gcc و libpython در مستندات محصول نگاهی بیندازید.