تحويل PDF إلى MHTML باستخدام Python

PDF إلى MHTML و HtmlFixed وتحويل HTML في تطبيقات Python دون تثبيت Microsoft Word ®.

 

بالنسبة لمطور Python ، الذي يحاول إضافة ميزة تحويل PDF إلى MHTML (تنسيق أرشيف الويب) أو يعني HtmlFixed ، يريد حفظ المستند بتنسيق HTML باستخدام العناصر الموضوعة تمامًا داخل التطبيق. يمكن أن تساعد Aspose.Total for Python via .NET API في أتمتة عملية التحويل. إنها حزمة كاملة من واجهات برمجة التطبيقات المختلفة التي تتعامل مع تنسيقات مختلفة.

نحن نستخدم Aspose.Words for Python via .NET API الذي يعد جزءًا من حزمة Aspose.Total for Python via .NET لإضافة ميزة تحويل PDF إلى MHTML. في حال كان ملف PDF بسيطًا ، فسيكون من سطرين فقط من الكود. قم بتحميل ملف PDF واستدعاء طريقة الحفظ بمسار الملف المناسب مع تعداد SaveFormat كـ MHTML أو HTML_FIXED. ولكن في حالة ما إذا كانت هناك حاجة لاستعادة نموذج المستند أقرب ما يكون إلى النموذج الأصلي ، فهناك حاجة إلى حفظ بعض المعلومات الإضافية في المستند الناتج الذي يسمى معلومات الرحلة ذهابًا وإيابًا.

كيف تحويل PDF إلى MHTML في Python

  • قم بتحميل ملف PDF المصدر باستخدام فئة Document
  • قم بإنشاء مثيل HtmlSaveOptions
  • قم بتعيين export_roundtrip_information كـ True
  • حدد SaveFormat كـ MHTML
  • قم باستدعاء طريقة “save” أثناء تحديد مسار ملف الإخراج & SaveFormat كمعلمات. لذلك يتم تحويل ملف PDF الخاص بك إلى MHTML في المسار المحدد.

متطلبات التحويل

  • لتحويل PDF إلى MHTML أو HtmlFixed ، يلزم Python 3.5 أو أحدث
  • واجهات برمجة التطبيقات المرجعية داخل المشروع مباشرة من PyPI ( Aspose.Words )
  • أو استخدم أوامر النقطة التالية `` تثبيت النقطة لكلمات الغرض ’’ `.
  • علاوة على ذلك ، فإن نظام التشغيل Microsoft Windows أو Linux (انظر المزيد عن Words ) وللينكس تحقق من المتطلبات الإضافية لـ gcc و libpython واتبع التعليمات خطوة بخطوة INSTALL
 

حفظ PDF إلى MHTML في Python - بسيط

 
 

PDF إلى MHTML التحويل في Python

 
تحويل PDF إلى MHTML باستخدام واجهات برمجة تطبيقات بايثون يساعد على تحويل محتوى المستند إلى تنسيق أرشيف ويب يجمع بين العلامات والموارد المدمجة في ملف واحد. هذا يجعل معلومات PDF أسهل في الحفظ أو العرض أو التوزيع في بيئات متوافقة مع المتصفح. تحسين الأتمتة يزيد من قيمة هذا التحويل من خلال تمكين إنشاء ملفات ويب جاهزة محمولة على نطاق واسع من المستندات الثابتة. يدعم النشر المحتوى، والأرشفة، والتكامل مع الأنظمة التي تتطلب مخرجات مستند ويب ذاتي الاحتواء.

حالات الاستخدام الرئيسية

  • إنشاء أرشيف ويب
    تحويل ملفات PDF إلى MHTML للتخزين والعرض عبر المتصفح.

  • نشر المستندات المحمولة
    مشاركة محتوى المستند في تنسيق ويب ذاتي الاحتواء وصديق للمستخدم.

  • حفظ المحتوى
    الاحتفاظ بالمعلومات البصرية والنصية في أرشيف ملائم لتدفقات عمل الويب.

  • قابلية التفاعل بين الأنظمة
    استخدام مخرجات MHTML حيث يجب أن يتوافق تبادل المستندات مع معايير متوافقة مع المتصفح.

سيناريوهات الأتمتة

  • خطوط أنابيب تحويل الويب المؤتمتة
    يمكن لسكربتات بايثون تحويل ملفات PDF إلى ملفات MHTML لأنظمة النشر الرقمي.

  • تدفقات عمل توزيع الأرشيف
    يمكن تسليم المخرجات المحولة إلى المستودعات التي تدير محتوى أرشيف الويب.

  • نشر المستندات على دفعات
    يمكن تحويل مجموعات كبيرة من ملفات PDF إلى ملفات ويب محمولة دون تدخل يدوي.

  • تصدير المحتوى الديناميكي
    يمكن للأنظمة إنشاء إصدارات MHTML من المستندات عند الطلب للمشاركة أو المراجعة.

استكشف PDF خيارات التحويل مع Python

تحويل PDFs إلى EMAIL (ملفات البريد الإلكتروني)
تحويل PDFs إلى EML (رسالة الكترونية)
تحويل PDFs إلى EMLX (رسالة بريد Apple)
تحويل PDFs إلى ICS (ملف التقويم)
تحويل PDFs إلى MBOX (ملف صندوق البريد الإلكتروني)
تحويل PDFs إلى MSG (ملف عنصر رسالة Outlook)
تحويل PDFs إلى OFT (قالب ملف Outlook)
تحويل PDFs إلى OST (جدول تخزين Outlook دون اتصال)
تحويل PDFs إلى PST (جدول التخزين الشخصي في Outlook)