แปลง DOC เป็น MHTML โดยใช้ Python

การแปลง DOC เป็น MHTML, HtmlFixed และ HTML ในแอปพลิเคชัน Python ของคุณโดยไม่ต้องติดตั้ง Microsoft Word®

 

สำหรับนักพัฒนา Python ที่กำลังพยายามเพิ่มคุณสมบัติการแปลง DOC เป็น MHTML (รูปแบบไฟล์เก็บถาวรบนเว็บ) หรือ HtmlFixed หมายถึงต้องการบันทึกเอกสารในรูปแบบ HTML โดยใช้องค์ประกอบที่จัดตำแหน่งไว้อย่างสมบูรณ์ภายในแอปพลิเคชัน Aspose.Total for Python via .NET API สามารถช่วยทำให้กระบวนการแปลงเป็นไปโดยอัตโนมัติ เป็นแพ็คเกจเต็มรูปแบบของ API ต่างๆ ที่จัดการรูปแบบต่างๆ

เราใช้ Aspose.Words for Python via .NET API ซึ่งเป็นส่วนหนึ่งของ Aspose.Total for Python via .NET Package เพื่อเพิ่มคุณลักษณะการแปลง DOC เป็น MHTML ในกรณีที่ไฟล์ DOC ง่าย ๆ ก็จะมีโค้ดเพียงสองบรรทัด โหลดไฟล์ DOC และเรียกวิธีการบันทึกด้วยเส้นทางไฟล์ที่เหมาะสมพร้อมกับการแจงนับ SaveFormat เป็น MHTML หรือ HTML_FIXED แต่ในกรณีที่จำเป็นต้องคืนค่ารูปแบบเอกสารให้ใกล้เคียงกับต้นฉบับ ก็จำเป็นต้องบันทึกข้อมูลเพิ่มเติมไว้ในเอกสารผลลัพธ์ที่เรียกว่า ข้อมูลการเดินทางไปกลับ

ทำอย่างไร แปลง DOC เป็น MHTML ใน Python

  • โหลดไฟล์ DOC ต้นทางโดยใช้คลาส Document
  • สร้างอินสแตนซ์ของ HtmlSaveOptions
  • ตั้งค่า export_roundtrip_information เป็น True
  • ระบุ SaveFormat เป็น MHTML
  • เรียกใช้เมธอด `บันทึก’ ขณะที่ระบุพาธไฟล์เอาต์พุต & SaveFormat เป็นพารามิเตอร์ ดังนั้นไฟล์ DOC ของคุณจะถูกแปลงเป็น MHTML ตามเส้นทางที่ระบุ

ข้อกำหนดการแปลง

  • สำหรับการแปลงรูปแบบ DOC เป็น MHTML หรือ HtmlFixed จำเป็นต้องใช้ Python 3.5 หรือใหม่กว่า
  • อ้างอิง API ภายในโครงการโดยตรงจาก PyPI ( Aspose.Words )
  • หรือใช้คำสั่ง pip ต่อไปนี้ pip install aspose.words
  • นอกจากนี้ ระบบปฏิบัติการที่ใช้ Microsoft Windows หรือ Linux (ดูเพิ่มเติมสำหรับ Words ) และสำหรับ Linux ให้ตรวจสอบข้อกำหนดเพิ่มเติมสำหรับ gcc และ libpython และปฏิบัติตามคำแนะนำทีละขั้นตอน INSTALL
 

บันทึก DOC เป็น MHTML ใน Python - Simple

 
 

การแปลง DOC เป็น MHTML ใน Python

 

สำรวจ DOC ตัวเลือกการแปลงด้วย Python

แปลง DOC S TO CSV (ค่าที่คั่นด้วยเครื่องหมายจุลภาค)
แปลง DOC S TO DIF (รูปแบบการแลกเปลี่ยนข้อมูล)
แปลง DOC S TO EMAIL (ไฟล์อีเมล)
แปลง DOC S TO EML (ข้อความอีเมล)
แปลง DOC S TO EMLX (ข้อความ Apple Mail)
แปลง DOC S TO EXCEL (รูปแบบไฟล์สเปรดชีต)
แปลง DOC S TO FODS (สเปรดชีต OpenDocument Flat XML)
แปลง DOC S TO ICS (ไฟล์ปฏิทิน)
แปลง DOC S TO MBOX (ไฟล์กล่องจดหมายอีเมล)
แปลง DOC S TO MSG (ไฟล์รายการข้อความ Outlook)
แปลง DOC S TO ODP (รูปแบบการนำเสนอ OpenDocument)
แปลง DOC S TO ODS (OpenDocument สเปรดชีต)
แปลง DOC S TO OFT (เทมเพลตไฟล์ Outlook)
แปลง DOC S TO OST (ตารางที่เก็บข้อมูลออฟไลน์ของ Outlook)
แปลง DOC S TO POT (ไฟล์เทมเพลต Microsoft PowerPoint)
แปลง DOC S TO POTM (ไฟล์เทมเพลต Microsoft PowerPoint)
แปลง DOC S TO POTX (การนำเสนอเทมเพลต Microsoft PowerPoint)
แปลง DOC S TO POWERPOINT (ไฟล์นำเสนอ)
แปลง DOC S TO PPS (สไลด์โชว์ PowerPoint)
แปลง DOC S TO PPSM (สไลด์โชว์ที่เปิดใช้งานมาโคร)
แปลง DOC S TO PPSX (สไลด์โชว์ PowerPoint)
แปลง DOC S TO PPT (การนำเสนอพาวเวอร์พ้อยท์)
แปลง DOC S TO PPTM (ไฟล์นำเสนอที่เปิดใช้งานมาโคร)
แปลง DOC S TO PPTX (เปิดรูปแบบการนำเสนอ XML)
แปลง DOC S TO PST (ตารางที่เก็บข้อมูลส่วนตัวของ Outlook)
แปลง DOC S TO SXC (สเปรดชีตคำนวณ StarOffice)
แปลง DOC S TO TSV (ค่าที่คั่นด้วยแท็บ)
แปลง DOC S TO VCF (ไฟล์ vCard)
แปลง DOC S TO XLAM (Add-in ที่เปิดใช้งานแมโครของ Excel)
แปลง DOC S TO XLS (รูปแบบไบนารีของ Microsoft Excel)
แปลง DOC S TO XLSB (สมุดงานไบนารีของ Excel)
แปลง DOC S TO XLSM (สเปรดชีตที่เปิดใช้งานมาโคร)
แปลง DOC S TO XLSX (เปิดสมุดงาน XML)
แปลง DOC S TO XLT (เทมเพลต Excel 97 - 2003)
แปลง DOC S TO XLTM (เทมเพลตที่เปิดใช้งานแมโครของ Excel)
แปลง DOC S TO XLTX (เทมเพลต Excel)

DOC รูปแบบไฟล์คืออะไร

รูปแบบไฟล์ไบนารีของ Microsoft Word (DOC) เป็นรูปแบบไฟล์เอกสารที่เป็นกรรมสิทธิ์ซึ่งใช้โดย Microsoft Office Word เป็นการแสดงโครงสร้างเอกสารที่ไม่ขึ้นกับสถาปัตยกรรมคอมพิวเตอร์หรือระบบปฏิบัติการใดๆ รูปแบบ DOC ทำหน้าที่เป็นไฟล์คอนเทนเนอร์ โดยใช้รูปแบบไบนารีเพื่อจัดเก็บข้อมูลประเภทต่างๆ รวมถึงข้อความที่จัดรูปแบบ รูปภาพ แผนภูมิ และอื่นๆ ลักษณะไบนารีของรูปแบบ DOC ทำให้ไม่สามารถอ่านได้โดยมนุษย์ แต่มีหลายโปรแกรม เช่น Microsoft Word และ LibreOffice ที่สามารถอ่านและเขียนไปยังไฟล์ DOC ได้

รูปแบบ DOC เริ่มแรก เปิดตัวใน Word สำหรับ Windows 2.0 เมื่อปี 1987 ตั้งแต่นั้นมาก็มีการแก้ไขหลายครั้ง โดยรูปแบบล่าสุดคือรูปแบบ Office Open XML ที่นำมาใช้ใน Office 2007 ข้อดีหลักประการหนึ่งของรูปแบบ DOC อยู่ที่ความเข้ากันได้กับ Microsoft Word ซึ่งเป็นหนึ่งในแอพพลิเคชั่นประมวลผลคำที่ใช้กันอย่างแพร่หลายทั่วโลก ความเข้ากันได้นี้ทำให้ผู้ใช้สามารถสร้างและแก้ไขเอกสารโดยใช้ Microsoft Word และแชร์กับผู้อื่นที่ใช้แอปพลิเคชันนี้ได้อย่างสะดวก นอกจากนี้ แอปพลิเคชันประมวลผลคำอื่นๆ จำนวนมากมีความสามารถในการอ่านและเขียนในรูปแบบ DOC ทำให้เป็นตัวเลือกที่หลากหลายสำหรับวัตถุประสงค์ในการแบ่งปันเอกสาร

การนำรูปแบบ DOC มาใช้อย่างแพร่หลายเกิดจากการรวมเข้ากับ Microsoft Word ให้ผู้ใช้มีสภาพแวดล้อมที่แข็งแกร่งและเต็มไปด้วยคุณสมบัติสำหรับการสร้างและจัดการเอกสาร ความยืดหยุ่นของรูปแบบนี้ครอบคลุมมากกว่า Microsoft Word ทำให้ผู้ใช้สามารถทำงานกับไฟล์ DOC โดยใช้ซอฟต์แวร์ประมวลผลคำทางเลือก ความสามารถรอบด้านนี้ทำให้มั่นใจได้ถึงการทำงานร่วมกันของเอกสารที่ราบรื่นและการแลกเปลี่ยนระหว่างผู้ใช้ โดยไม่คำนึงถึงแอปพลิเคชันการประมวลผลคำที่เลือก

MHTML รูปแบบไฟล์คืออะไร

MHTML ย่อมาจาก MIME HTML เป็นรูปแบบไฟล์ที่รวมรหัส HTML และทรัพยากรที่เกี่ยวข้องไว้ในไฟล์เดียว ย่อมาจาก Multipurpose Internet Mail Extension HTML ไฟล์ MHTML มักใช้สำหรับบันทึกหน้าเว็บ รวมถึงเนื้อหาทั้งหมด เช่น รูปภาพ สไตล์ชีต CSS และ JavaScript ให้เป็นไฟล์เดียว

ไฟล์ MHTML มักจะสร้างโดยเว็บเบราว์เซอร์เมื่อผู้ใช้บันทึกหน้าเว็บสำหรับออฟไลน์ วัตถุประสงค์ในการดูหรือการเก็บถาวร ด้วยการรวมทรัพยากรที่จำเป็นทั้งหมดไว้ในไฟล์เดียว MHTML ช่วยให้มั่นใจได้ว่าหน้าเว็บสามารถดูและแสดงผลได้อย่างถูกต้อง แม้จะไม่มีการเชื่อมต่ออินเทอร์เน็ตหรือเข้าถึงเซิร์ฟเวอร์ดั้งเดิมก็ตาม

รูปแบบ MHTML เป็นไปตามมาตรฐาน MIME ซึ่ง ใช้สำหรับเข้ารหัสและแลกเปลี่ยนข้อมูลประเภทต่างๆ ทางอินเทอร์เน็ต ใช้การเข้ารหัส MIME หลายส่วนเพื่อรวมรหัส HTML และทรัพยากรที่เกี่ยวข้องไว้ในไฟล์เดียว โดยทั่วไปไฟล์จะมีนามสกุลไฟล์ .mht หรือ .mhtml

ไฟล์ MHTML สามารถเปิดและดูได้โดยเว็บเบราว์เซอร์ที่รองรับรูปแบบ เช่น Internet Explorer, Microsoft Edge และ Opera โปรแกรมแก้ไขข้อความและซอฟต์แวร์พิเศษบางตัวยังให้ความสามารถในการเปิดและแก้ไขไฟล์ MHTML ได้ด้วย

รูปแบบ MHTML มีข้อดีในแง่ของการพกพาและความสะดวกสบาย เนื่องจากช่วยให้ผู้ใช้สามารถบันทึกและแบ่งปันหน้าเว็บเป็นไฟล์เดียว รับประกันการรักษาโครงร่าง การจัดรูปแบบ และทรัพยากรที่เชื่อมโยงของเพจ อย่างไรก็ตาม เป็นที่น่าสังเกตว่า MHTML ไม่ได้ใช้กันอย่างแพร่หลายเท่ากับรูปแบบเว็บอื่นๆ เช่น HTML หรือ PDF และความเข้ากันได้อาจแตกต่างกันไปตามซอฟต์แวร์และแพลตฟอร์มต่างๆ