Converter PDF para MHTML usando Python

Conversão de PDF para MHTML, HtmlFixed e HTML em seus aplicativos Python sem instalar o Microsoft Word®.

 

Para um desenvolvedor Python, que está tentando adicionar um recurso de conversão PDF para MHTML (formato de arquivo da Web) ou HtmlFixed, quer salvar o documento no formato HTML usando elementos absolutamente posicionados dentro do aplicativo. A API Aspose.Total for Python via .NET pode ajudar a automatizar o processo de conversão. É um pacote completo de várias APIs que lidam com diferentes formatos.

Usamos a API Aspose.Words for Python via .NET que faz parte do pacote Aspose.Total for Python via .NET para adicionar o recurso de conversão PDF para MHTML. Caso o arquivo PDF seja simples, são apenas duas linhas de código. Carregue o arquivo PDF e chame o método save com o caminho de arquivo apropriado junto com a enumeração SaveFormat como MHTML ou HTML_FIXED. Mas, caso haja necessidade de restaurar o modelo de documento o mais próximo possível do original, será necessário salvar algumas informações extras no documento resultante chamado informações de ida e volta.

Como Converter PDF para MHTML em Python

  • Carregar arquivo PDF de origem usando a classe Document
  • Crie a instância de HtmlSaveOptions
  • Defina o export_roundtrip_information como True
  • Especifique o SaveFormat como MHTML
  • Chame o método save enquanto especifica o caminho do arquivo de saída e SaveFormat como parâmetros. Portanto, seu arquivo PDF é convertido em MHTML no caminho especificado.

Requisitos de conversão

  • Para conversão de formato PDF para MHTML ou HtmlFixed, é necessário o Python 3.5 ou posterior
  • APIs de referência dentro do projeto diretamente do PyPI ( Aspose.Words )
  • Ou use os seguintes comandos pip pip install aspose.words
  • Além disso, SO baseado em Microsoft Windows ou Linux (veja mais para Words ) e para Linux verifique os requisitos adicionais para gcc e libpython e siga as instruções passo a passo INSTALL
 

Salvar PDF para MHTML em Python - Simples

 
 

Conversão de PDF para MHTML em Python

 

Explore PDF Opções de conversão com Python

Converter PDFs para EMAIL (Arquivos de e-mail)
Converter PDFs para EML (Mensagem de email)
Converter PDFs para EMLX (Mensagem do Apple Mail)
Converter PDFs para ICS (arquivo de calendário)
Converter PDFs para MBOX (Arquivo de caixa de correio de e-mail)
Converter PDFs para MSG (Arquivo de item de mensagem do Outlook)
Converter PDFs para OFT (Modelo de arquivo do Outlook)
Converter PDFs para OST (Tabela de armazenamento offline do Outlook)
Converter PDFs para PST (Tabela de armazenamento pessoal do Outlook)
Converter PDFs para VCF (Arquivo vCard)