Chuyển đổi WORD sang MHTML bằng Python

Chuyển đổi WORD sang MHTML, HtmlFixed và HTML trong Ứng dụng Python của bạn mà không cần cài đặt Microsoft Word ®.

 

Đối với một nhà phát triển Python, những người đang cố gắng thêm tính năng chuyển đổi WORD sang MHTML (Định dạng lưu trữ web) hoặc HtmlFixed có nghĩa là muốn lưu tài liệu ở định dạng HTML bằng cách sử dụng các phần tử được định vị hoàn toàn trong ứng dụng. Aspose.Total for Python via .NET API có thể giúp tự động hóa quá trình chuyển đổi. Đó là một gói đầy đủ các API khác nhau xử lý các định dạng khác nhau.

Chúng tôi sử dụng API Aspose.Words for Python via .NET nằm trong Gói Aspose.Total for Python via .NET để thêm tính năng chuyển đổi WORD sang MHTML. Trong trường hợp tệp WORD đơn giản thì nó chỉ có hai dòng mã. Tải tệp WORD và gọi phương thức lưu với đường dẫn tệp thích hợp cùng với kiểu liệt kê SaveFormat dưới dạng MHTML hoặc HTML_FIXED. Nhưng trong trường hợp cần khôi phục mô hình tài liệu gần giống với mô hình ban đầu thì cần phải lưu thêm một số thông tin trong tài liệu kết quả được gọi là thông tin khứ hồi.

Làm thế nào để Chuyển đổi WORD sang MHTML bằng Python

  • Tải tệp WORD nguồn bằng lớp Document
  • Tạo phiên bản của HtmlSaveOptions
  • Đặt export_roundtrip_information là True
  • Chỉ định SaveFormat dưới dạng MHTML
  • Gọi phương thức save trong khi chỉ định đường dẫn tệp đầu ra & SaveFormat làm tham số. Vì vậy, tệp WORD của bạn được chuyển đổi thành MHTML theo đường dẫn được chỉ định.

Yêu cầu chuyển đổi

  • Để chuyển đổi định dạng WORD sang MHTML hoặc HtmlFixed, Python 3.5 trở lên là bắt buộc
  • Tham khảo các API trong dự án trực tiếp từ PyPI ( Aspose.Words )
  • Hoặc sử dụng các lệnh pip sau `` pip install aspose.words ‘’.
  • Hơn nữa, hệ điều hành dựa trên Microsoft Windows hoặc Linux (xem thêm cho Words ) và cho Linux, hãy kiểm tra các yêu cầu bổ sung cho gcc và libpython và làm theo hướng dẫn từng bước INSTALL
 

Lưu WORD thành MHTML bằng Python - Đơn giản

 
 

Chuyển đổi WORD sang MHTML bằng Python

 

Khám phá WORD Chuyển Đổi Tùy Chọn với Python

Chuyển đổi WORD S đến CSV (Giá trị được phân tách bằng dấu phẩy)
Chuyển đổi WORD S đến DIF (Định dạng trao đổi dữ liệu)
Chuyển đổi WORD S đến EMLX (Tin nhắn Apple Mail)
Chuyển đổi WORD S đến EXCEL (Định dạng tệp bảng tính)
Chuyển đổi WORD S đến FODS (OpenDocument Bảng tính XML phẳng)
Chuyển đổi WORD S đến MBOX (Tệp hộp thư email)
Chuyển đổi WORD S đến MSG (Tệp mục tin nhắn Outlook)
Chuyển đổi WORD S đến ODP (Định dạng trình bày OpenDocument)
Chuyển đổi WORD S đến ODS (Bảng tính OpenDocument)
Chuyển đổi WORD S đến OFT (Mẫu tệp Outlook)
Chuyển đổi WORD S đến OST (Bảng Lưu trữ Ngoại tuyến Outlook)
Chuyển đổi WORD S đến POT (Tệp mẫu Microsoft PowerPoint)
Chuyển đổi WORD S đến POTM (Tệp mẫu Microsoft PowerPoint)
Chuyển đổi WORD S đến POTX (Bản trình bày mẫu Microsoft PowerPoint)
Chuyển đổi WORD S đến PPS (Trình chiếu PowerPoint)
Chuyển đổi WORD S đến PPSM (Trình chiếu kích hoạt macro)
Chuyển đổi WORD S đến PPSX (Trình chiếu PowerPoint)
Chuyển đổi WORD S đến PPT (Thuyết trình Powerpoint)
Chuyển đổi WORD S đến PPTM (Tệp trình bày hỗ trợ macro)
Chuyển đổi WORD S đến PPTX (Định dạng bản trình bày XML mở)
Chuyển đổi WORD S đến PST (Bảng lưu trữ cá nhân Outlook)
Chuyển đổi WORD S đến SXC (Bảng tính StarOffice Calc)
Chuyển đổi WORD S đến TSV (Các giá trị được phân tách bằng tab)
Chuyển đổi WORD S đến XLAM (Phần bổ trợ hỗ trợ Macro của Excel)
Chuyển đổi WORD S đến XLS (Định dạng nhị phân Microsoft Excel)
Chuyển đổi WORD S đến XLSB (Sổ làm việc nhị phân Excel)
Chuyển đổi WORD S đến XLSM (Bảng tính hỗ trợ macro)
Chuyển đổi WORD S đến XLSX (Mở sổ làm việc XML)
Chuyển đổi WORD S đến XLT (Mẫu Excel 97 - 2003)
Chuyển đổi WORD S đến XLTM (Mẫu hỗ trợ macro Excel)

Những gì là WORD Tập Tin Định Dạng

Microsoft Word, một phần mềm xử lý văn bản được sử dụng rộng rãi, cung cấp một loạt các định dạng tệp để lưu và chia sẻ tài liệu. Định dạng mặc định là DOC, phổ biến trong các phiên bản Word trước đó. Tuy nhiên, định dạng mới hơn và hiệu quả hơn, DOCX, đã trở thành lựa chọn mặc định do kích thước tệp nhỏ hơn và khả năng khôi phục dữ liệu nâng cao. PDF là một định dạng thường được sử dụng khác giúp duy trì định dạng và bố cục trong khi vẫn có thể xem dễ dàng trên mọi thiết bị.

Để tương thích với các ứng dụng phần mềm khác nhau, định dạng RTF đóng vai trò là định dạng văn bản thuần túy có thể dễ dàng trao đổi. Mặt khác, HTML được sử dụng đặc biệt để tạo các trang web. ODT, một định dạng nguồn mở, đảm bảo khả năng tương thích với các ứng dụng phần mềm khác nhau, trong khi TXT là một định dạng văn bản thuần túy đơn giản chỉ chứa chính văn bản đó.

Việc chọn định dạng phù hợp phụ thuộc vào một số yếu tố, bao gồm cả ứng dụng dự kiến, khả năng tương thích với phần mềm khác, cũng như kích thước và độ phức tạp của tài liệu. Bằng cách tự làm quen với các định dạng có sẵn, người dùng có thể tối ưu hóa quy trình làm việc của mình và đưa ra quyết định sáng suốt về định dạng phù hợp nhất cho tài liệu cụ thể của họ.

Những gì là MHTML Tập Tin Định Dạng

MHTML, viết tắt của MIME HTML, là một định dạng tệp kết hợp mã HTML và các tài nguyên liên quan của nó thành một tệp duy nhất. Nó là viết tắt của HTML mở rộng thư Internet đa năng. Các tệp MHTML thường được sử dụng để lưu các trang web, bao gồm tất cả nội dung của chúng, chẳng hạn như hình ảnh, biểu định kiểu CSS và JavaScript, vào một tệp duy nhất.

Tệp MHTML thường được tạo bởi trình duyệt web khi người dùng lưu các trang web để sử dụng ngoại tuyến mục đích xem hoặc lưu trữ. Bằng cách gộp tất cả các tài nguyên cần thiết vào một tệp, MHTML đảm bảo rằng trang web có thể được xem và hiển thị chính xác, ngay cả khi không có kết nối internet hoặc quyền truy cập vào máy chủ gốc.

Định dạng MHTML tuân theo tiêu chuẩn MIME, trong đó được sử dụng để mã hóa và trao đổi các loại dữ liệu khác nhau qua internet. Nó sử dụng mã hóa MIME nhiều phần để đóng gói mã HTML và các tài nguyên liên quan vào một tệp duy nhất. Tệp thường có phần mở rộng tệp .mht hoặc .mhtml.

Tệp MHTML có thể được mở và xem bằng các trình duyệt web hỗ trợ định dạng này, chẳng hạn như Internet Explorer, Microsoft Edge và Opera. Một số trình soạn thảo văn bản và phần mềm chuyên dụng cũng cung cấp khả năng mở và chỉnh sửa các tệp MHTML.

Định dạng MHTML mang lại lợi thế về tính di động và sự tiện lợi vì nó cho phép người dùng lưu và chia sẻ các trang web dưới dạng một tệp duy nhất, đảm bảo duy trì bố cục, định dạng và tài nguyên được liên kết của trang. Tuy nhiên, điều đáng chú ý là MHTML không được sử dụng rộng rãi như các định dạng web khác như HTML hoặc PDF và khả năng tương thích có thể khác nhau giữa các phần mềm và nền tảng khác nhau.