قابلیت ادغام PDF به DOCX از طریق Python

ادغام اسناد PDF به فرمت های تک DOCX در دات نت با استفاده از پایتون. برنامه نویسان می‌توانند از این کد نمونه برای ترکیب PDF در دات نت فریم ورک، دات نت هسته، و PHP، VBScript، دلفی، C++ از طریق COM Interop استفاده کنند.

قابلیت ادغام PDF به DOCX با استفاده از Python

چگونه می توان PDF را به DOCX ادغام کرد؟ با استفاده از کتابخانه Aspose.PDF برای پایتون از طریق دات نت می توانید PDF را به صورت برنامه نویسی DOCX ادغام کنید. نرم افزار PDF از Aspose ایده آل برای افراد، کسب و کارهای کوچک یا بزرگ است. از آنجا که قادر به پردازش مقدار زیادی از اطلاعات است، پیوند را به سرعت و کارآمد انجام دهید و از داده های خود محافظت کنید. یک ویژگی عجیب و غریب از Aspose.PDF یک API برای ادغام PDF به DOCX است. ویژگی این رویکرد این است که شما فقط نیاز به باز کردن مدیر بسته NuGet، جستجو برای Aspose.pdf برای دات نت، و نصب آن بدون هیچ گونه تنظیمات پیچیده خاص. (از دستور کنسول مدیر بسته برای نصب استفاده کنید). جزئیات نصب کتابخانه را در صفحات مستندات بررسی کنید. برای بررسی مزایای کتابخانه، سعی کنید از تبدیل PDF به قطعه کد DOCX استفاده کنید.

Python Package Manager Console

pip install aspose-pdf

نحوه ادغام PDF به DOCX از طریق Python


توسعه دهندگان Python for .NET به راحتی می توانند پرونده های PDF را فقط در چند خط کد در DOCX بارگذاری و ادغام کنند.

  1. یک سند جدید را مقداردهی کنید و یک حلقه برای ادغام فایل ها اجرا کنید
  2. در حلقه: اضافه کردن یک صفحه جدید به سند DOCX
  3. در حلقه: اضافه کردن فایل PDF به صفحه جدید
  4. پس از حلقه نتیجه را ذخیره کنید

در اینجا مثالی وجود دارد که نحوه ادغام PDF را به DOCX در Python نشان می دهد. چندین اسناد را با سهولت در یک فایل واحد ترکیب کنید. اگر شما در حال توسعه کد در Python هستید، این کار می تواند ساده تر از آن باشد که به نظر می رسد. شما می توانید از نام فایل های کاملاً واجد شرایط برای خواندن PDF و نوشتن DOCX استفاده کنید. این مثال Python را بررسی کنید که نحوه ادغام چندین سند از نوع فایل یکسان یا متفاوت در یک فایل با استفاده از Python را نشان می دهد

ادغام فایل های PDF با استفاده از Python for .NET و ذخیره به عنوان DOCX

مثال Python: این کد نمونه پیوند PDF را به DOCX نشان می دهد

Input file:

File not added

File not added

Output format:

DOCX

Output file:


    # create empty pdf document
    output_doc = aspose.pdf.Document()

    # read pdf file to Aspose Document
    first_doc = aspose.pdf.Document("1.pdf")
    second_doc = aspose.pdf.Document("2.pdf")

    # add page from one document to another directly
    for page in first_doc.pages:
        output_doc.pages.add(page)
    for page in second_doc.pages:
        output_doc.pages.add(page)

    # save pdf to Microsoft Word docx format
    # use docx format
    # make document editable flow and recognize of tables
    opt1 = DocSaveOptions
    opt1.Format = DocSaveOptions.DocFormat.DOC_X,
    opt1.Mode = DocSaveOptions.RecognitionMode.ENHANCED_FLOW
    output_doc.save("Merger_pdf_docx.docx", opt1)

Python for .NET کتابخانه برای ترکیب PDF به DOCX

Aspose.PDF برای پایتون از طریق .NET API از اکثر استانداردهای PDF و مشخصات PDF پشتیبانی می کند. این به توسعه دهندگان اجازه می دهد تا جداول، نمودارها، تصاویر، هایپرلینک ها، فونت های سفارشی - و موارد دیگر - را در اسناد PDF وارد کنند. علاوه بر این، فشرده سازی اسناد PDF نیز امکان پذیر است. Aspose.PDF برای پایتون از طریق .NET ویژگی های امنیتی عالی را برای توسعه اسناد PDF امن فراهم می کند. برخی از ویژگی های کلیدی Aspose.PDF برای پایتون از طریق .NET API عبارتند از:

  • امکان خواندن و صادرات PDF در چندین فرمت تصویر از جمله BMP، GIF، JPEG و PNG.
  • اطلاعات اساسی (به عنوان مثال نویسنده، خالق) سند PDF را تنظیم کنید.
  • ویژگی های تبدیل: تبدیل PDF به ورد، اکسل و پاورپوینت. تبدیل PDF به فرمت های تصاویر تبدیل فایل PDF به فرمت HTML و بالعکس. تبدیل PDF به EPUB، متن، XPS و غیره

شما می توانید اطلاعات بیشتری در مورد Aspose.PDF برای Python از طریق .NET API در [مستندات] ما (https://docs.aspose.com/pdf/python-net/overview/) در مورد نحوه استفاده از API پیدا کنید.