تبدیل MHTML به TXT از طریق Python

MHTML به TXT تبدیل پایتون. برنامه نویسان می توانند از این کد مثال برای صادرات MHTML به TXT در هر فریمورک .NET، .NET Core و PHP، VBScript، C++ از طریق COM Interop استفاده کنند.

تبدیل MHTML به TXT به Python via .NET

چگونه MHTML را به TXT تبدیل کنیم؟ شما به راحتی می توانید یک سند را از طریق برنامه نویسی از MHTML به فرمت TXT با یک API مدرن برای پردازش اسناد Python تبدیل کنید. فقط از چند خط کد برای تبدیل فایل ها با کیفیت بالا استفاده کنید. کتابخانه Aspose.PDF به هر توسعه دهنده ای اجازه می دهد تا به راحتی وظایف تبدیل MHTML به TXT را با استفاده از پایتون حل کند.

برای توضیحات بیشتر در مورد قطعه کد و سایر قالب‌های تبدیل ممکن، به صفحات Documentation مراجعه کنید. همچنین، می‌توانید سایر تبدیل‌ها قالب‌ها را که توسط کتابخانه ما پشتیبانی می‌شوند، بررسی کنید.

با کتابخانه Aspose.PDF for Python via .NET می توانید MHTML را به صورت برنامه ریزی شده به TXT تبدیل کنید. نرم افزار PDF از Aspose برای افراد، مشاغل کوچک یا بزرگ ایده آل است. از آنجایی که قادر به پردازش حجم زیادی از اطلاعات است، تبدیل را به سرعت و کارآمد انجام داده و از داده های شما محافظت می کند. یک ویژگی خاص از Aspose.PDF یک API برای تبدیل MHTML به TXT است. ویژگی این رویکرد این است که شما فقط باید مدیر بسته PyPI را باز کنید، aspose-pdf را جستجو کنید، و آن را بدون هیچ تنظیمات پیچیده خاصی نصب کنید. برای تأیید مزایای کتابخانه، سعی کنید از قطعه کد تبدیل MHTML به TXT استفاده کنید. همچنین می توانید از دستور زیر از کنسول یا ترمینال استفاده کنید:

Console

pip install aspose-pdf

چگونه برای تبدیل MHTML به TXT


Python via .NET توسعه دهندگان می توانند به راحتی فایل های MHTML را فقط در چند خط کد به TXT بارگذاری و تبدیل کنند.

  1. ماژول های مورد نیاز را از کتابخانه aspose.pdf از جمله کلاس Document برای بارگذاری فایل های PDF وارد کنید. قبل از ادامه، مطمئن شوید که کتابخانه های لازم نصب و وارد شده اند.
  2. مسیر سند PDF ورودی را با پیوستن indir با infile مشخص کنید و از ساختار دایرکتوری صحیح اطمینان حاصل کنید. این مرحله برای مکان یابی صحیح فایل ورودی در درخت دایرکتوری مشخص شده بسیار مهم است.
  3. یک نمونه از کلاس MhtLoadOptions ایجاد کنید تا فرمت خروجی را برای ذخیره سند مشخص کنید. این گزینه ها ویژگی های فایل HTML تبدیل شده را کنترل می کنند. MhtLoadOptions برای پیکربندی رفتار فرآیند تبدیل استفاده می شود.
  4. سند PDF ورودی را با استفاده از apdf در یک شی Document بارگیری کنید. Document() را دریافت کنید. سند بارگذاری شده برای پردازش و ذخیره در فرمت های دیگر استفاده می شود. قبل از ادامه فرآیند تبدیل، مطمئن شوید که فایل PDF به درستی بارگذاری شده است.
  5. تعداد کل صفحات در سند PDF بارگذاری شده را با استفاده از تابع len() بازیابی کنید. این مرحله اطلاعات ضروری در مورد محتویات و طرح بندی فایل ورودی ارائه می دهد.
  6. یک نمونه از کلاس TextDevice ایجاد کنید تا نوع دستگاه مورد استفاده برای پردازش سند، از جمله وضوح، عمق رنگ و سایر تنظیمات آن را مشخص کنید. دستگاه انتخاب شده بر کیفیت و ظاهر فایل خروجی تولید شده تأثیر می گذارد.
  7. از دستگاه تعریف شده برای پردازش یک صفحه از سند PDF بارگذاری شده استفاده کنید و تصویر تبدیل شده را در مسیر خروجی مشخص شده ذخیره کنید. این مرحله یک فایل خروجی جدید در قالب مشخص شده تولید می کند.
  8. پس از ذخیره سند تبدیل شده، یک پیام موفقیت آمیز چاپ کنید که نشان می دهد تبدیل کامل شده است. این مرحله تأیید می کند که فرآیند تبدیل موفقیت آمیز بوده است و فایل های خروجی را می توان در مسیرهای مشخص شده یافت.

در اینجا مثالی آورده شده است که نحوه تبدیل MHTML را به TXT در Python نشان می دهد. شما می توانید این مراحل آسان را برای تبدیل فایل MHTML خود به فرمت TXT دنبال کنید. ابتدا فایل MHTML خود را آپلود کنید و سپس آن را به عنوان یک فایل TXT ذخیره کنید. شما می توانید از نام فایل های کاملا واجد شرایط برای هر دو MHTML خواندن و نوشتن TXT استفاده کنید. محتوای خروجی TXT و قالب بندی با سند اصلی MHTML یکسان خواهد بود.

مثال: تبدیل MHTML به TXT از طریق Python

این نمونه کد نشان می دهد MHTML به TXT Python تبدیل

Input file:

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)
print(len(document.pages))
device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

تبدیل MHTML به TXT با استفاده از Python via .NET

Aspose.PDF برای پایتون از طریق .NET API از اکثر استانداردهای PDF و مشخصات PDF پشتیبانی می کند. این به توسعه دهندگان اجازه می دهد تا جداول، نمودارها، تصاویر، هایپرلینک ها، فونت های سفارشی - و موارد دیگر - را در اسناد PDF وارد کنند. علاوه بر این، فشرده سازی اسناد PDF نیز امکان پذیر است. Aspose.PDF برای پایتون از طریق .NET ویژگی های امنیتی عالی را برای توسعه اسناد PDF امن فراهم می کند. برخی از ویژگی های کلیدی Aspose.PDF برای پایتون از طریق .NET API عبارتند از:

  • امکان خواندن و صادرات PDF در چندین فرمت تصویر از جمله BMP، GIF، JPEG و PNG.
  • اطلاعات اساسی (به عنوان مثال نویسنده، خالق) سند PDF را تنظیم کنید.
  • ویژگی های تبدیل: تبدیل PDF به ورد، اکسل و پاورپوینت. تبدیل PDF به فرمت های تصاویر تبدیل فایل PDF به فرمت HTML و بالعکس. تبدیل PDF به EPUB، متن، XPS و غیره

شما می توانید اطلاعات بیشتری در مورد Aspose.PDF برای Python از طریق .NET API در [مستندات] ما (https://docs.aspose.com/pdf/python-net/overview/) در مورد نحوه استفاده از API پیدا کنید.