Chuyển đổi WORDML sang MHTML bằng Python

Chuyển đổi WORDML sang MHTML, HtmlFixed và HTML trong Ứng dụng Python của bạn mà không cần cài đặt Microsoft Word ®.

 

Đối với một nhà phát triển Python, những người đang cố gắng thêm tính năng chuyển đổi WORDML sang MHTML (Định dạng lưu trữ web) hoặc HtmlFixed có nghĩa là muốn lưu tài liệu ở định dạng HTML bằng cách sử dụng các phần tử được định vị hoàn toàn trong ứng dụng. Aspose.Total for Python via .NET API có thể giúp tự động hóa quá trình chuyển đổi. Đó là một gói đầy đủ các API khác nhau xử lý các định dạng khác nhau.

Chúng tôi sử dụng API Aspose.Words for Python via .NET nằm trong Gói Aspose.Total for Python via .NET để thêm tính năng chuyển đổi WORDML sang MHTML. Trong trường hợp tệp WORDML đơn giản thì nó chỉ có hai dòng mã. Tải tệp WORDML và gọi phương thức lưu với đường dẫn tệp thích hợp cùng với kiểu liệt kê SaveFormat dưới dạng MHTML hoặc HTML_FIXED. Nhưng trong trường hợp cần khôi phục mô hình tài liệu gần giống với mô hình ban đầu thì cần phải lưu thêm một số thông tin trong tài liệu kết quả được gọi là thông tin khứ hồi.

Làm thế nào để Chuyển đổi WORDML sang MHTML bằng Python

  • Tải tệp WORDML nguồn bằng lớp Document
  • Tạo phiên bản của HtmlSaveOptions
  • Đặt export_roundtrip_information là True
  • Chỉ định SaveFormat dưới dạng MHTML
  • Gọi phương thức save trong khi chỉ định đường dẫn tệp đầu ra & SaveFormat làm tham số. Vì vậy, tệp WORDML của bạn được chuyển đổi thành MHTML theo đường dẫn được chỉ định.

Yêu cầu chuyển đổi

  • Để chuyển đổi định dạng WORDML sang MHTML hoặc HtmlFixed, Python 3.5 trở lên là bắt buộc
  • Tham khảo các API trong dự án trực tiếp từ PyPI ( Aspose.Words )
  • Hoặc sử dụng các lệnh pip sau `` pip install aspose.words ‘’.
  • Hơn nữa, hệ điều hành dựa trên Microsoft Windows hoặc Linux (xem thêm cho Words ) và cho Linux, hãy kiểm tra các yêu cầu bổ sung cho gcc và libpython và làm theo hướng dẫn từng bước INSTALL
 

Lưu WORDML thành MHTML bằng Python - Đơn giản

 
 

Chuyển đổi WORDML sang MHTML bằng Python

 

Khám phá WORDML Chuyển Đổi Tùy Chọn với Python

Chuyển đổi WORDML S đến CSV (Giá trị được phân tách bằng dấu phẩy)
Chuyển đổi WORDML S đến DIF (Định dạng trao đổi dữ liệu)
Chuyển đổi WORDML S đến EMLX (Tin nhắn Apple Mail)
Chuyển đổi WORDML S đến EXCEL (Định dạng tệp bảng tính)
Chuyển đổi WORDML S đến FODS (OpenDocument Bảng tính XML phẳng)
Chuyển đổi WORDML S đến MBOX (Tệp hộp thư email)
Chuyển đổi WORDML S đến MSG (Tệp mục tin nhắn Outlook)
Chuyển đổi WORDML S đến ODP (Định dạng trình bày OpenDocument)
Chuyển đổi WORDML S đến ODS (Bảng tính OpenDocument)
Chuyển đổi WORDML S đến OST (Bảng Lưu trữ Ngoại tuyến Outlook)
Chuyển đổi WORDML S đến POT (Tệp mẫu Microsoft PowerPoint)
Chuyển đổi WORDML S đến POTM (Tệp mẫu Microsoft PowerPoint)
Chuyển đổi WORDML S đến POTX (Bản trình bày mẫu Microsoft PowerPoint)
Chuyển đổi WORDML S đến PPS (Trình chiếu PowerPoint)
Chuyển đổi WORDML S đến PPSM (Trình chiếu kích hoạt macro)
Chuyển đổi WORDML S đến PPSX (Trình chiếu PowerPoint)
Chuyển đổi WORDML S đến PPT (Thuyết trình Powerpoint)
Chuyển đổi WORDML S đến PPTM (Tệp trình bày hỗ trợ macro)
Chuyển đổi WORDML S đến PPTX (Định dạng bản trình bày XML mở)
Chuyển đổi WORDML S đến PST (Bảng lưu trữ cá nhân Outlook)
Chuyển đổi WORDML S đến SXC (Bảng tính StarOffice Calc)
Chuyển đổi WORDML S đến TSV (Các giá trị được phân tách bằng tab)
Chuyển đổi WORDML S đến XLAM (Phần bổ trợ hỗ trợ Macro của Excel)
Chuyển đổi WORDML S đến XLS (Định dạng nhị phân Microsoft Excel)
Chuyển đổi WORDML S đến XLSB (Sổ làm việc nhị phân Excel)
Chuyển đổi WORDML S đến XLSM (Bảng tính hỗ trợ macro)
Chuyển đổi WORDML S đến XLSX (Mở sổ làm việc XML)
Chuyển đổi WORDML S đến XLT (Mẫu Excel 97 - 2003)
Chuyển đổi WORDML S đến XLTM (Mẫu hỗ trợ macro Excel)

Những gì là WORDML Tập Tin Định Dạng

Microsoft Word 2003 đã giới thiệu một định dạng tài liệu độc quyền được gọi là WordprocessingML. Định dạng này, dựa trên XML, sử dụng lược đồ XML tùy chỉnh để lưu trữ các thành phần khác nhau của tài liệu Word, bao gồm văn bản, định dạng, hình ảnh và nội dung khác. WordprocessingML nhằm mục đích cung cấp một bản trình bày toàn diện về tất cả thông tin tài liệu trong khi vẫn duy trì cả chất lượng mà con người có thể đọc được và máy có thể đọc được.

Trở nên con người có thể đọc được có nghĩa là các tài liệu WordprocessingML có thể dễ dàng truy cập và chỉnh sửa bằng trình soạn thảo văn bản tiêu chuẩn. Khả năng truy cập này cho phép người dùng thao tác trực tiếp cấu trúc XML bên dưới nếu cần. Ngoài ra, WordprocessingML được thiết kế để tạo điều kiện cho các hệ thống máy tính xử lý và chuyển đổi tự động, cho phép chuyển đổi liền mạch sang các định dạng khác hoặc tích hợp với các ứng dụng phần mềm khác nhau.

WordprocessingML là một tiêu chuẩn mở, nghĩa là các thông số kỹ thuật của nó được cung cấp công khai để tham khảo và thực hiện bởi các nhà phát triển. Tính mở này đã thúc đẩy sự phát triển của nhiều chương trình phần mềm, bao gồm các giải pháp nguồn mở như OpenOffice.org và LibreOffice, có thể đọc và viết các tài liệu WordprocessingML. Tính khả dụng của các công cụ như vậy mở rộng khả năng truy cập và khả năng tương tác của các tệp WordprocessingML ngoài hệ sinh thái Microsoft Word.

Microsoft Word, là một trong những chương trình xử lý văn bản được sử dụng rộng rãi nhất trên toàn thế giới, đã góp phần vào sự phổ biến của WordprocessingML dưới dạng XML -dựa trên định dạng xử lý văn bản. Sự chấp nhận rộng rãi của nó đã thiết lập WordprocessingML như một tiêu chuẩn phổ biến để chia sẻ và trao đổi các tài liệu có định dạng phong phú.

Những gì là MHTML Tập Tin Định Dạng

MHTML, viết tắt của MIME HTML, là một định dạng tệp kết hợp mã HTML và các tài nguyên liên quan của nó thành một tệp duy nhất. Nó là viết tắt của HTML mở rộng thư Internet đa năng. Các tệp MHTML thường được sử dụng để lưu các trang web, bao gồm tất cả nội dung của chúng, chẳng hạn như hình ảnh, biểu định kiểu CSS và JavaScript, vào một tệp duy nhất.

Tệp MHTML thường được tạo bởi trình duyệt web khi người dùng lưu các trang web để sử dụng ngoại tuyến mục đích xem hoặc lưu trữ. Bằng cách gộp tất cả các tài nguyên cần thiết vào một tệp, MHTML đảm bảo rằng trang web có thể được xem và hiển thị chính xác, ngay cả khi không có kết nối internet hoặc quyền truy cập vào máy chủ gốc.

Định dạng MHTML tuân theo tiêu chuẩn MIME, trong đó được sử dụng để mã hóa và trao đổi các loại dữ liệu khác nhau qua internet. Nó sử dụng mã hóa MIME nhiều phần để đóng gói mã HTML và các tài nguyên liên quan vào một tệp duy nhất. Tệp thường có phần mở rộng tệp .mht hoặc .mhtml.

Tệp MHTML có thể được mở và xem bằng các trình duyệt web hỗ trợ định dạng này, chẳng hạn như Internet Explorer, Microsoft Edge và Opera. Một số trình soạn thảo văn bản và phần mềm chuyên dụng cũng cung cấp khả năng mở và chỉnh sửa các tệp MHTML.

Định dạng MHTML mang lại lợi thế về tính di động và sự tiện lợi vì nó cho phép người dùng lưu và chia sẻ các trang web dưới dạng một tệp duy nhất, đảm bảo duy trì bố cục, định dạng và tài nguyên được liên kết của trang. Tuy nhiên, điều đáng chú ý là MHTML không được sử dụng rộng rãi như các định dạng web khác như HTML hoặc PDF và khả năng tương thích có thể khác nhau giữa các phần mềm và nền tảng khác nhau.