تحويل DOC إلى MHTML باستخدام Python

DOC إلى MHTML و HtmlFixed وتحويل HTML في تطبيقات Python دون تثبيت Microsoft Word ®.

 

بالنسبة لمطور Python ، الذي يحاول إضافة ميزة تحويل DOC إلى MHTML (تنسيق أرشيف الويب) أو يعني HtmlFixed ، يريد حفظ المستند بتنسيق HTML باستخدام العناصر الموضوعة تمامًا داخل التطبيق. يمكن أن تساعد Aspose.Total for Python via .NET API في أتمتة عملية التحويل. إنها حزمة كاملة من واجهات برمجة التطبيقات المختلفة التي تتعامل مع تنسيقات مختلفة.

نحن نستخدم Aspose.Words for Python via .NET API الذي يعد جزءًا من حزمة Aspose.Total for Python via .NET لإضافة ميزة تحويل DOC إلى MHTML. في حال كان ملف DOC بسيطًا ، فسيكون من سطرين فقط من الكود. قم بتحميل ملف DOC واستدعاء طريقة الحفظ بمسار الملف المناسب مع تعداد SaveFormat كـ MHTML أو HTML_FIXED. ولكن في حالة ما إذا كانت هناك حاجة لاستعادة نموذج المستند أقرب ما يكون إلى النموذج الأصلي ، فهناك حاجة إلى حفظ بعض المعلومات الإضافية في المستند الناتج الذي يسمى معلومات الرحلة ذهابًا وإيابًا.

كيف تحويل DOC إلى MHTML في Python

  • قم بتحميل ملف DOC المصدر باستخدام فئة Document
  • قم بإنشاء مثيل HtmlSaveOptions
  • قم بتعيين export_roundtrip_information كـ True
  • حدد SaveFormat كـ MHTML
  • قم باستدعاء طريقة “save” أثناء تحديد مسار ملف الإخراج & SaveFormat كمعلمات. لذلك يتم تحويل ملف DOC الخاص بك إلى MHTML في المسار المحدد.

متطلبات التحويل

  • لتحويل DOC إلى MHTML أو HtmlFixed ، يلزم Python 3.5 أو أحدث
  • واجهات برمجة التطبيقات المرجعية داخل المشروع مباشرة من PyPI ( Aspose.Words )
  • أو استخدم أوامر النقطة التالية `` تثبيت النقطة لكلمات الغرض ’’ `.
  • علاوة على ذلك ، فإن نظام التشغيل Microsoft Windows أو Linux (انظر المزيد عن Words ) وللينكس تحقق من المتطلبات الإضافية لـ gcc و libpython واتبع التعليمات خطوة بخطوة INSTALL
 

حفظ DOC إلى MHTML في Python - بسيط

 
 

DOC إلى MHTML التحويل في Python

 

استكشف DOC خيارات التحويل مع Python

تحويل DOCs إلى CSV (قيم مفصولة بفواصل)
تحويل DOCs إلى DIF (تنسيق تبادل البيانات)
تحويل DOCs إلى EMAIL (ملفات البريد الإلكتروني)
تحويل DOCs إلى EML (رسالة الكترونية)
تحويل DOCs إلى EMLX (رسالة بريد Apple)
تحويل DOCs إلى EXCEL (تنسيقات ملفات جدول البيانات)
تحويل DOCs إلى FODS (جدول بيانات XML مسطح OpenDocument)
تحويل DOCs إلى ICS (ملف التقويم)
تحويل DOCs إلى MBOX (ملف صندوق البريد الإلكتروني)
تحويل DOCs إلى MSG (ملف عنصر رسالة Outlook)
تحويل DOCs إلى ODP (تنسيق العرض التقديمي OpenDocument)
تحويل DOCs إلى ODS (جدول بيانات OpenDocument)
تحويل DOCs إلى OFT (قالب ملف Outlook)
تحويل DOCs إلى OST (جدول تخزين Outlook دون اتصال)
تحويل DOCs إلى POT (ملفات قالب Microsoft PowerPoint)
تحويل DOCs إلى POTM (ملف قالب Microsoft PowerPoint)
تحويل DOCs إلى POTX (عرض تقديمي لقالب Microsoft PowerPoint)
تحويل DOCs إلى POWERPOINT (ملفات العروض التقديمية)
تحويل DOCs إلى PPS (عرض شرائح PowerPoint)
تحويل DOCs إلى PPSM (عرض الشرائح الممكنة بماكرو)
تحويل DOCs إلى PPSX (عرض شرائح PowerPoint)
تحويل DOCs إلى PPT (عرض باور بوينت)
تحويل DOCs إلى PPTM (ملف العرض التقديمي الممكّن بماكرو)
تحويل DOCs إلى PPTX (افتح تنسيق عرض XML)
تحويل DOCs إلى PST (جدول التخزين الشخصي في Outlook)
تحويل DOCs إلى SXC (StarOffice Calc Spreadsheet)
تحويل DOCs إلى TSV (قيم مفصولة بعلامات جدولة)
تحويل DOCs إلى XLAM (وظيفة إضافية ممكّنة بماكرو في Excel)
تحويل DOCs إلى XLS (تنسيق Microsoft Excel الثنائي)
تحويل DOCs إلى XLSB (مصنف Excel الثنائي)
تحويل DOCs إلى XLSM (جدول بيانات ممكّن بماكرو)
تحويل DOCs إلى XLSX (افتح مصنف XML)
تحويل DOCs إلى XLT (قالب Excel 97-2003)
تحويل DOCs إلى XLTM (قالب Excel ممكن بماكرو)

ما هو DOC تنسيق الملف

تنسيق ملف Microsoft Word الثنائي (DOC) هو تنسيق ملف مستند خاص يستخدمه Microsoft Office Word. إنه يمثل بنية مستند مستقلة عن أي بنية كمبيوتر أو نظام تشغيل محدد. يعمل تنسيق DOC كملف حاوية ، باستخدام تنسيق ثنائي لتخزين أنواع مختلفة من البيانات ، بما في ذلك النص المنسق والصور والمخططات والمزيد. الطبيعة الثنائية لتنسيق DOC تجعله غير قابل للقراءة من قبل الإنسان ، ولكن توجد العديد من البرامج ، مثل Microsoft Word و LibreOffice ، التي يمكنها القراءة من ملفات DOC والكتابة إليها.

كان تنسيق DOC في البداية تم تقديمه في Word for Windows 2.0 في عام 1987. وقد خضع للعديد من المراجعات منذ ذلك الحين ، وكان أحدثها هو تنسيق Office Open XML الذي تم تقديمه في Office 2007. تكمن إحدى المزايا الرئيسية لتنسيق DOC في توافقه مع Microsoft Word ، أحد أكثر تطبيقات معالجة الكلمات استخدامًا على مستوى العالم. يتيح هذا التوافق للمستخدمين إنشاء المستندات وتعديلها باستخدام Microsoft Word ومشاركتها بسهولة مع الآخرين الذين يستخدمون التطبيق أيضًا. علاوة على ذلك ، تمتلك العديد من تطبيقات معالجة النصوص الأخرى القدرة على القراءة من تنسيق DOC والكتابة إليه ، مما يجعله خيارًا متعدد الاستخدامات لأغراض مشاركة المستندات.

ينبع الاعتماد الواسع النطاق لتنسيق DOC من تكامله مع Microsoft Word ، مما يوفر للمستخدمين بيئة قوية وغنية بالميزات لإنشاء المستندات وإدارتها. تمتد مرونة التنسيق إلى ما هو أبعد من Microsoft Word ، مما يتيح للمستخدمين العمل مع ملفات DOC باستخدام برامج معالجة كلمات بديلة. يضمن هذا التنوع تعاونًا سلسًا مع المستندات وإمكانية التبادل بين المستخدمين ، بغض النظر عن تطبيق معالجة الكلمات الذي يختارونه.

ما هو MHTML تنسيق الملف

MHTML ، اختصار لـ MIME HTML ، هو تنسيق ملف يجمع بين كود HTML والموارد المرتبطة به في ملف واحد. وهي تعني امتداد HTML لبريد الإنترنت متعدد الأغراض. تُستخدم ملفات MHTML بشكل شائع لحفظ صفحات الويب ، بما في ذلك كل محتوياتها مثل الصور وأوراق أنماط CSS وجافا سكريبت في ملف واحد.

غالبًا ما يتم إنشاء ملفات MHTML بواسطة متصفحات الويب عندما يحفظ المستخدمون صفحات الويب بلا اتصال عرض أو أرشفة الأغراض. من خلال تجميع جميع الموارد اللازمة في ملف واحد ، تضمن MHTML إمكانية عرض صفحة الويب وعرضها بدقة ، حتى بدون اتصال بالإنترنت أو الوصول إلى الخادم الأصلي.

يتبع تنسيق MHTML معيار MIME ، والذي يستخدم لترميز وتبادل أنواع مختلفة من البيانات عبر الإنترنت. يستخدم ترميز MIME متعدد الأجزاء لحزم كود HTML والموارد المرتبطة في ملف واحد. عادةً ما يكون الملف بامتداد .mht أو .mhtml.

يمكن فتح ملفات MHTML وعرضها بواسطة مستعرضات الويب التي تدعم التنسيق ، مثل Internet Explorer و Microsoft Edge و Opera. توفر بعض برامج تحرير النصوص والبرامج المتخصصة أيضًا القدرة على فتح ملفات MHTML وتعديلها.

يوفر تنسيق MHTML مزايا من حيث قابلية النقل والراحة ، حيث يتيح للمستخدمين حفظ صفحات الويب ومشاركتها كملف واحد ، ضمان الحفاظ على تخطيط الصفحة وتنسيقها والموارد المرتبطة. ومع ذلك ، تجدر الإشارة إلى أن MHTML لا تستخدم على نطاق واسع مثل تنسيقات الويب الأخرى مثل HTML أو PDF ، وقد يختلف التوافق عبر البرامج والأنظمة الأساسية المختلفة.