باستخدام Aspose.Total for Java يمكنك دمج ميزة تحويل MHTML إلى TXT في تطبيقات Java في عملية من خطوتين. أولاً ، باستخدام Aspose.PDF for Java يمكنك تحويل MHTML إلى XLSX. في الخطوة الثانية ، يمكنك تحويل XLSX إلى TXT باستخدام Spreadsheet Programming API Aspose.Cells for Java .
تحويل ملف MHTML إلى TXT عبر Java
متطلبات التحويل
يمكنك بسهولة استخدام Aspose.Total for Java مباشرة من مشروع قائم على Maven وتشمل Aspose.PDF for Java و Aspose.Cells for Java في ملف pom.xml الخاص بك.
متطلبات التحويل
إذا كان مستند MHTML الخاص بك محميًا بكلمة مرور ، فلا يمكنك تحويله إلى TXT بدون كلمة المرور. باستخدام واجهة برمجة التطبيقات ، يمكنك أولاً فتح المستند المحمي باستخدام كلمة مرور صالحة وتحويلها بعد ذلك. لفتح الملف المشفر ، يمكنك تهيئة مثيل جديد من Document فئة وتمرير اسم الملف وكلمة المرور كوسيطات.
تحويل Protected MHTML إلى TXT عبر Java
أثناء تحويل ملف MHTML إلى TXT ، يمكنك أيضًا إضافة علامة مائية إلى تنسيق ملف TXT الناتج. لإضافة علامة مائية ، قم بإنشاء مصنف جديد لفتح ملف XLSX المحول. حدد ورقة العمل عبر الفهرس الخاص بها ، وأنشئ شكلًا واستخدم وظيفة addTextEffect الخاصة به ، وقم بتعيين الألوان والشفافية والمزيد. بعد ذلك يمكنك حفظ مستند XLSX كملف TXT مع علامة مائية.
حالات الاستخدام الرئيسية
أرشفة محتوى الويب كنص عادي للقراءة دون اتصال.
استخراج تقارير نصية من صفحات MHTML للتحليل.
تحويل المقالات أو البرامج التعليمية عبر الإنترنت إلى TXT للرجوع السريع.
تحضير المحتوى لمعالجة النصوص، والتعلم الآلي، أو أدوات الذكاء الاصطناعي.
سيناريوهات الأتمتة
تحويل دفعة MHTML إلى TXT لأرشفة الويب على نطاق واسع.
استخراج البيانات النصية من صفحات الويب بشكل مجدول للتحليل.
دمجها مع أنابيب الذكاء الاصطناعي/التعلم الآلي لمعالجة النصوص تلقائيًا.
تحويل مُشغّل لمراقبة وتقارير محتوى الويب في الوقت الحقيقي.