Konversi DOC ke MHTML menggunakan Python

Konversi DOC ke MHTML, HtmlFixed, dan HTML di Aplikasi Python Anda tanpa menginstal Microsoft Word®.

 

Untuk pengembang Python, yang mencoba menambahkan fitur konversi DOC ke MHTML (format arsip Web) atau HtmlFixed berarti ingin menyimpan dokumen dalam format HTML menggunakan elemen yang benar-benar diposisikan di dalam aplikasi. Aspose.Total for Python via .NET API dapat membantu mengotomatiskan proses konversi. Ini adalah paket lengkap dari berbagai API yang menangani format berbeda.

Kami menggunakan API Aspose.Words for Python via .NET yang merupakan bagian dari Paket Aspose.Total for Python via .NET untuk menambahkan fitur konversi DOC ke MHTML. Jika file DOC sederhana maka hanya dua baris kode. Muat file DOC dan panggil metode simpan dengan jalur file yang sesuai bersama dengan enumerasi SaveFormat sebagai MHTML atau HTML_FIXED. Tetapi jika ada kebutuhan untuk mengembalikan model dokumen sedekat mungkin dengan aslinya maka ada kebutuhan untuk menyimpan beberapa informasi tambahan dalam dokumen yang dihasilkan yang disebut informasi bolak-balik.

Bagaimana caranya? Konversi DOC ke MHTML dengan Python

  • Muat file DOC sumber menggunakan kelas Document
  • Buat instance HtmlSaveOptions
  • Atur export_roundtrip_information sebagai True
  • Tentukan SaveFormat sebagai MHTML
  • Panggil metode save sambil menentukan jalur file keluaran & SaveFormat sebagai parameter. Jadi file DOC Anda dikonversi ke MHTML di jalur yang ditentukan.

Persyaratan Konversi

  • Untuk konversi format DOC ke MHTML atau HtmlFixed, diperlukan Python 3.5 atau yang lebih baru
  • Referensi API dalam proyek langsung dari PyPI ( Aspose.Words )
  • Atau gunakan perintah pip berikut pip install aspose.words
  • Selain itu, OS berbasis Microsoft Windows atau Linux (lihat selengkapnya untuk Words ) dan untuk Linux periksa persyaratan tambahan untuk gcc dan libpython dan ikuti petunjuk langkah demi langkah INSTALL
 

Simpan DOC Ke MHTML dengan Python - Sederhana

 
 

Konversi DOC Ke MHTML dengan Python

 

Jelajahi opsi konversi DOC dengan Python

Mengkonversi DOCs ke EMLX (Pesan Surat Apple)
Mengkonversi DOCs ke ICS (Berkas Kalender)
Mengkonversi DOCs ke MBOX (File Kotak Surat Email)
Mengkonversi DOCs ke MSG (File Item Pesan Outlook)
Mengkonversi DOCs ke ODP (Format Presentasi Dokumen Terbuka)
Mengkonversi DOCs ke OFT (Templat File Outlook)
Mengkonversi DOCs ke OST (Tabel Penyimpanan Offline Outlook)
Mengkonversi DOCs ke POT (File Templat Microsoft PowerPoint)
Mengkonversi DOCs ke POTM (File Templat Microsoft PowerPoint)
Mengkonversi DOCs ke POTX (Presentasi Templat Microsoft PowerPoint)
Mengkonversi DOCs ke PPS (Peragaan Slide PowerPoint)
Mengkonversi DOCs ke PPSM (Peragaan Slide dengan Makro aktif)
Mengkonversi DOCs ke PPSX (Peragaan Slide PowerPoint)
Mengkonversi DOCs ke PPT (Presentasi powerpoint)
Mengkonversi DOCs ke PPTM (File Presentasi dengan Makro aktif)
Mengkonversi DOCs ke PPTX (Buka Format presentasi XML)
Mengkonversi DOCs ke PST (Tabel Penyimpanan Pribadi Outlook)
Mengkonversi DOCs ke CSV (Nilai Dipisahkan Koma)
Mengkonversi DOCs ke DIF (Format Pertukaran Data)
Mengkonversi DOCs ke EXCEL (Format File Spreadsheet)
Mengkonversi DOCs ke FODS (OpenDocument Flat XML Spreadsheet)
Mengkonversi DOCs ke ODS (Spreadsheet Dokumen Terbuka)
Mengkonversi DOCs ke SXC (Spreadsheet StarOffice Calc)
Mengkonversi DOCs ke TSV (Nilai yang dipisahkan tab)
Mengkonversi DOCs ke XLAM (Add-In dengan Makro Excel yang Diaktifkan)
Mengkonversi DOCs ke XLS (Format Biner Microsoft Excel)
Mengkonversi DOCs ke XLSB (Buku Kerja Biner Excel)
Mengkonversi DOCs ke XLSM (Spreadsheet yang diaktifkan makro)
Mengkonversi DOCs ke XLSX (Buka Buku Kerja XML)
Mengkonversi DOCs ke XLT (Excel 97 - Templat 2003)
Mengkonversi DOCs ke XLTM (Template Berkemampuan Makro Excel)

Apa itu Format File DOC

Format File Biner Microsoft Word (DOC) adalah format file dokumen berpemilik yang digunakan oleh Microsoft Office Word. Ini mewakili struktur dokumen yang tidak tergantung pada arsitektur komputer atau sistem operasi tertentu. Format DOC berfungsi sebagai file penampung, menggunakan format biner untuk menyimpan berbagai jenis data, termasuk teks berformat, gambar, bagan, dan lainnya. Sifat biner dari format DOC membuatnya tidak dapat dibaca oleh manusia, tetapi ada beberapa program, seperti Microsoft Word dan LibreOffice, yang dapat membaca dari dan menulis ke file DOC.

Format DOC pada awalnya diperkenalkan di Word untuk Windows 2.0 pada tahun 1987. Ini telah mengalami beberapa revisi sejak saat itu, dengan iterasi terbaru adalah format Office Open XML yang diperkenalkan di Office 2007. Salah satu keunggulan utama format DOC terletak pada kompatibilitasnya dengan Microsoft Word , salah satu aplikasi pengolah kata yang paling banyak digunakan secara global. Kompatibilitas ini memungkinkan pengguna untuk membuat dan memodifikasi dokumen menggunakan Microsoft Word dan membagikannya dengan mudah kepada orang lain yang juga menggunakan aplikasi tersebut. Selain itu, banyak aplikasi pengolah kata lainnya memiliki kemampuan untuk membaca dari dan menulis ke format DOC, menjadikannya pilihan serbaguna untuk tujuan berbagi dokumen.

Pengadopsian format DOC secara luas berasal dari integrasinya dengan Microsoft Word , memberi pengguna lingkungan yang kuat dan kaya fitur untuk membuat dan mengelola dokumen. Fleksibilitas format melampaui Microsoft Word, memungkinkan pengguna untuk bekerja dengan file DOC menggunakan perangkat lunak pengolah kata alternatif. Keserbagunaan ini memastikan kolaborasi dokumen yang mulus dan pertukaran di antara pengguna, terlepas dari aplikasi pengolah kata yang mereka pilih.

Apa itu Format File MHTML

MHTML, kependekan dari MIME HTML, adalah format file yang menggabungkan kode HTML dan sumber daya yang terkait ke dalam satu file. Itu adalah singkatan dari Multiguna Internet Mail Extension HTML. File MHTML biasanya digunakan untuk menyimpan halaman web, termasuk semua kontennya seperti gambar, lembar gaya CSS, dan JavaScript, ke dalam satu file.

File MHTML sering kali dibuat oleh browser web saat pengguna menyimpan halaman web untuk offline melihat atau tujuan pengarsipan. Dengan menggabungkan semua sumber daya yang diperlukan ke dalam satu file, MHTML memastikan bahwa halaman web dapat dilihat dan dirender secara akurat, bahkan tanpa koneksi internet atau akses ke server asli.

Format MHTML mengikuti standar MIME, yang digunakan untuk penyandian dan pertukaran berbagai jenis data melalui internet. Ini menggunakan pengkodean MIME multipart untuk mengemas kode HTML dan sumber daya terkait ke dalam satu file. File tersebut biasanya memiliki ekstensi file .mht atau .mhtml.

File MHTML dapat dibuka dan dilihat oleh browser web yang mendukung format tersebut, seperti Internet Explorer, Microsoft Edge, dan Opera. Beberapa editor teks dan perangkat lunak khusus juga memberikan kemampuan untuk membuka dan mengedit file MHTML.

Format MHTML menawarkan keuntungan dalam hal portabilitas dan kenyamanan, karena memungkinkan pengguna untuk menyimpan dan berbagi halaman web sebagai satu file, memastikan pelestarian tata letak halaman, pemformatan, dan sumber daya yang ditautkan. Namun, perlu dicatat bahwa MHTML tidak digunakan secara luas seperti format web lain seperti HTML atau PDF, dan kompatibilitasnya dapat bervariasi di berbagai perangkat lunak dan platform.