قابلیت ادغام PDF به TEXT از طریق Python

ادغام اسناد PDF به فرمت های تک TEXT در دات نت با استفاده از پایتون. برنامه نویسان می‌توانند از این کد نمونه برای ترکیب PDF در دات نت فریم ورک، دات نت هسته، و PHP، VBScript، دلفی، C++ از طریق COM Interop استفاده کنند.

قابلیت ادغام PDF به TEXT با استفاده از Python

چگونه می توان PDF را به TEXT ادغام کرد؟ با استفاده از کتابخانه Aspose.PDF برای پایتون از طریق دات نت می توانید PDF را به صورت برنامه نویسی TEXT ادغام کنید. نرم افزار PDF از Aspose ایده آل برای افراد، کسب و کارهای کوچک یا بزرگ است. از آنجا که قادر به پردازش مقدار زیادی از اطلاعات است، پیوند را به سرعت و کارآمد انجام دهید و از داده های خود محافظت کنید. یک ویژگی عجیب و غریب از Aspose.PDF یک API برای ادغام PDF به TEXT است. ویژگی این رویکرد این است که شما فقط نیاز به باز کردن مدیر بسته NuGet، جستجو برای Aspose.pdf برای دات نت، و نصب آن بدون هیچ گونه تنظیمات پیچیده خاص. (از دستور کنسول مدیر بسته برای نصب استفاده کنید). جزئیات نصب کتابخانه را در صفحات مستندات بررسی کنید. برای بررسی مزایای کتابخانه، سعی کنید از تبدیل PDF به قطعه کد TEXT استفاده کنید.

Python Package Manager Console

pip install aspose-pdf

نحوه ادغام PDF به TEXT از طریق Python


توسعه دهندگان Python for .NET به راحتی می توانند پرونده های PDF را فقط در چند خط کد در TEXT بارگذاری و ادغام کنند.

  1. دو فایل PDF را بخوانید
  2. ایجاد یک جاذب متن
  3. استخراج متن از فایل های PDF با اعمال TextAbsorber به هر دو PDF
  4. ذخیره متن استخراج شده
  5. نوشتن متن استخراج شده به یک فایل

در اینجا مثالی وجود دارد که نحوه ادغام PDF را به TEXT در Python نشان می دهد. چندین اسناد را با سهولت در یک فایل واحد ترکیب کنید. اگر شما در حال توسعه کد در Python هستید، این کار می تواند ساده تر از آن باشد که به نظر می رسد. شما می توانید از نام فایل های کاملاً واجد شرایط برای خواندن PDF و نوشتن TEXT استفاده کنید. این مثال Python را بررسی کنید که نحوه ادغام چندین سند از نوع فایل یکسان یا متفاوت در یک فایل با استفاده از Python را نشان می دهد

ادغام فایل های PDF با استفاده از Python for .NET و ذخیره به عنوان TEXT

مثال Python: این کد نمونه پیوند PDF را به TEXT نشان می دهد

Input file:

File not added

File not added

Output format:

TEXT

Output file:


# read PDF files to Aspose Document
first_doc = aspose.pdf.Document("1.pdf")
second_doc = aspose.pdf.Document("2.pdf")

# create text absorber for extract text
text_absorber = aspose.pdf.text.TextAbsorber()
first_doc.Accept(text_absorber)
second_doc.Accept(text_absorber)
extracted_text = text_absorber.Text
with open("Merger_pdf_text.txt", "w") as f:
    f.write(extracted_text)

Python for .NET کتابخانه برای ترکیب PDF به TEXT

Aspose.PDF برای پایتون از طریق .NET API از اکثر استانداردهای PDF و مشخصات PDF پشتیبانی می کند. این به توسعه دهندگان اجازه می دهد تا جداول، نمودارها، تصاویر، هایپرلینک ها، فونت های سفارشی - و موارد دیگر - را در اسناد PDF وارد کنند. علاوه بر این، فشرده سازی اسناد PDF نیز امکان پذیر است. Aspose.PDF برای پایتون از طریق .NET ویژگی های امنیتی عالی را برای توسعه اسناد PDF امن فراهم می کند. برخی از ویژگی های کلیدی Aspose.PDF برای پایتون از طریق .NET API عبارتند از:

  • امکان خواندن و صادرات PDF در چندین فرمت تصویر از جمله BMP، GIF، JPEG و PNG.
  • اطلاعات اساسی (به عنوان مثال نویسنده، خالق) سند PDF را تنظیم کنید.
  • ویژگی های تبدیل: تبدیل PDF به ورد، اکسل و پاورپوینت. تبدیل PDF به فرمت های تصاویر تبدیل فایل PDF به فرمت HTML و بالعکس. تبدیل PDF به EPUB، متن، XPS و غیره

شما می توانید اطلاعات بیشتری در مورد Aspose.PDF برای Python از طریق .NET API در [مستندات] ما (https://docs.aspose.com/pdf/python-net/overview/) در مورد نحوه استفاده از API پیدا کنید.