Para um desenvolvedor Python, que está tentando adicionar um recurso de conversão PDF para MHTML (formato de arquivo da Web) ou HtmlFixed, quer salvar o documento no formato HTML usando elementos absolutamente posicionados dentro do aplicativo. A API Aspose.Total for Python via .NET pode ajudar a automatizar o processo de conversão. É um pacote completo de várias APIs que lidam com diferentes formatos.
Usamos a API Aspose.Words for Python via .NET que faz parte do pacote Aspose.Total for Python via .NET para adicionar o recurso de conversão PDF para MHTML. Caso o arquivo PDF seja simples, são apenas duas linhas de código. Carregue o arquivo PDF e chame o método save com o caminho de arquivo apropriado junto com a enumeração SaveFormat como MHTML ou HTML_FIXED. Mas, caso haja necessidade de restaurar o modelo de documento o mais próximo possível do original, será necessário salvar algumas informações extras no documento resultante chamado informações de ida e volta.
Como Converter PDF para MHTML em Python
- Carregar arquivo PDF de origem usando a classe Document
- Crie a instância de HtmlSaveOptions
- Defina o export_roundtrip_information como True
- Especifique o SaveFormat como MHTML
- Chame o método
save
enquanto especifica o caminho do arquivo de saída e SaveFormat como parâmetros. Portanto, seu arquivo PDF é convertido em MHTML no caminho especificado.
Requisitos de conversão
- Para conversão de formato PDF para MHTML ou HtmlFixed, é necessário o Python 3.5 ou posterior
- APIs de referência dentro do projeto diretamente do PyPI ( Aspose.Words )
- Ou use os seguintes comandos pip
pip install aspose.words
- Além disso, SO baseado em Microsoft Windows ou Linux (veja mais para Words ) e para Linux verifique os requisitos adicionais para gcc e libpython e siga as instruções passo a passo INSTALL