Chuyển đổi PDF sang MHTML bằng Python

Chuyển đổi PDF sang MHTML, HtmlFixed và HTML trong Ứng dụng Python của bạn mà không cần cài đặt Microsoft Word ®.

 

Đối với một nhà phát triển Python, những người đang cố gắng thêm tính năng chuyển đổi PDF sang MHTML (Định dạng lưu trữ web) hoặc HtmlFixed có nghĩa là muốn lưu tài liệu ở định dạng HTML bằng cách sử dụng các phần tử được định vị hoàn toàn trong ứng dụng. Aspose.Total for Python via .NET API có thể giúp tự động hóa quá trình chuyển đổi. Đó là một gói đầy đủ các API khác nhau xử lý các định dạng khác nhau.

Chúng tôi sử dụng API Aspose.Words for Python via .NET nằm trong Gói Aspose.Total for Python via .NET để thêm tính năng chuyển đổi PDF sang MHTML. Trong trường hợp tệp PDF đơn giản thì nó chỉ có hai dòng mã. Tải tệp PDF và gọi phương thức lưu với đường dẫn tệp thích hợp cùng với kiểu liệt kê SaveFormat dưới dạng MHTML hoặc HTML_FIXED. Nhưng trong trường hợp cần khôi phục mô hình tài liệu gần giống với mô hình ban đầu thì cần phải lưu thêm một số thông tin trong tài liệu kết quả được gọi là thông tin khứ hồi.

Làm thế nào để Chuyển đổi PDF sang MHTML bằng Python

  • Tải tệp PDF nguồn bằng lớp Document
  • Tạo phiên bản của HtmlSaveOptions
  • Đặt export_roundtrip_information là True
  • Chỉ định SaveFormat dưới dạng MHTML
  • Gọi phương thức save trong khi chỉ định đường dẫn tệp đầu ra & SaveFormat làm tham số. Vì vậy, tệp PDF của bạn được chuyển đổi thành MHTML theo đường dẫn được chỉ định.

Yêu cầu chuyển đổi

  • Để chuyển đổi định dạng PDF sang MHTML hoặc HtmlFixed, Python 3.5 trở lên là bắt buộc
  • Tham khảo các API trong dự án trực tiếp từ PyPI ( Aspose.Words )
  • Hoặc sử dụng các lệnh pip sau `` pip install aspose.words ‘’.
  • Hơn nữa, hệ điều hành dựa trên Microsoft Windows hoặc Linux (xem thêm cho Words ) và cho Linux, hãy kiểm tra các yêu cầu bổ sung cho gcc và libpython và làm theo hướng dẫn từng bước INSTALL
 

Lưu PDF thành MHTML bằng Python - Đơn giản

 
 

Chuyển đổi PDF sang MHTML bằng Python

 

Khám phá PDF Chuyển Đổi Tùy Chọn với Python

Chuyển đổi PDF S đến EMLX (Tin nhắn Apple Mail)
Chuyển đổi PDF S đến MBOX (Tệp hộp thư email)
Chuyển đổi PDF S đến MSG (Tệp mục tin nhắn Outlook)
Chuyển đổi PDF S đến OFT (Mẫu tệp Outlook)
Chuyển đổi PDF S đến OST (Bảng Lưu trữ Ngoại tuyến Outlook)
Chuyển đổi PDF S đến PST (Bảng lưu trữ cá nhân Outlook)