Converter DOC para MHTML usando Python

Conversão de DOC para MHTML, HtmlFixed e HTML em seus aplicativos Python sem instalar o Microsoft Word®.

 

Para um desenvolvedor Python, que está tentando adicionar um recurso de conversão DOC para MHTML (formato de arquivo da Web) ou HtmlFixed, quer salvar o documento no formato HTML usando elementos absolutamente posicionados dentro do aplicativo. A API Aspose.Total for Python via .NET pode ajudar a automatizar o processo de conversão. É um pacote completo de várias APIs que lidam com diferentes formatos.

Usamos a API Aspose.Words for Python via .NET que faz parte do pacote Aspose.Total for Python via .NET para adicionar o recurso de conversão DOC para MHTML. Caso o arquivo DOC seja simples, são apenas duas linhas de código. Carregue o arquivo DOC e chame o método save com o caminho de arquivo apropriado junto com a enumeração SaveFormat como MHTML ou HTML_FIXED. Mas, caso haja necessidade de restaurar o modelo de documento o mais próximo possível do original, será necessário salvar algumas informações extras no documento resultante chamado informações de ida e volta.

Como Converter DOC para MHTML em Python

  • Carregar arquivo DOC de origem usando a classe Document
  • Crie a instância de HtmlSaveOptions
  • Defina o export_roundtrip_information como True
  • Especifique o SaveFormat como MHTML
  • Chame o método save enquanto especifica o caminho do arquivo de saída e SaveFormat como parâmetros. Portanto, seu arquivo DOC é convertido em MHTML no caminho especificado.

Requisitos de conversão

  • Para conversão de formato DOC para MHTML ou HtmlFixed, é necessário o Python 3.5 ou posterior
  • APIs de referência dentro do projeto diretamente do PyPI ( Aspose.Words )
  • Ou use os seguintes comandos pip pip install aspose.words
  • Além disso, SO baseado em Microsoft Windows ou Linux (veja mais para Words ) e para Linux verifique os requisitos adicionais para gcc e libpython e siga as instruções passo a passo INSTALL
 

Salvar DOC para MHTML em Python - Simples

 
 

Conversão de DOC para MHTML em Python

 

Explore DOC Opções de conversão com Python

Converter DOCs para CSV (Valores separados por vírgula)
Converter DOCs para DIF (Formato de Intercâmbio de Dados)
Converter DOCs para EMAIL (Arquivos de e-mail)
Converter DOCs para EML (Mensagem de email)
Converter DOCs para EMLX (Mensagem do Apple Mail)
Converter DOCs para EXCEL (Formatos de arquivo de planilha)
Converter DOCs para FODS (Planilha XML Plana OpenDocument)
Converter DOCs para ICS (arquivo de calendário)
Converter DOCs para MBOX (Arquivo de caixa de correio de e-mail)
Converter DOCs para MSG (Arquivo de item de mensagem do Outlook)
Converter DOCs para ODP (Formato de Apresentação OpenDocument)
Converter DOCs para ODS (Planilha OpenDocument)
Converter DOCs para OFT (Modelo de arquivo do Outlook)
Converter DOCs para OST (Tabela de armazenamento offline do Outlook)
Converter DOCs para POT (Arquivos de modelo do Microsoft PowerPoint)
Converter DOCs para POTM (Arquivo de modelo do Microsoft PowerPoint)
Converter DOCs para POTX (Modelo de apresentação do Microsoft PowerPoint)
Converter DOCs para POWERPOINT (Arquivos de apresentação)
Converter DOCs para PPS (Apresentação de slides do PowerPoint)
Converter DOCs para PPSM (Apresentação de slides habilitada para macro)
Converter DOCs para PPSX (Apresentação de slides do PowerPoint)
Converter DOCs para PPT (Apresentação em powerpoint)
Converter DOCs para PPTM (Arquivo de apresentação habilitado para macro)
Converter DOCs para PPTX (Formato de apresentação XML aberto)
Converter DOCs para PST (Tabela de armazenamento pessoal do Outlook)
Converter DOCs para SXC (Planilha do StarOffice Calc)
Converter DOCs para TSV (Valores separados por tabulações)
Converter DOCs para VCF (Arquivo vCard)
Converter DOCs para XLAM (Suplemento habilitado para macro do Excel)
Converter DOCs para XLS (Formato binário do Microsoft Excel)
Converter DOCs para XLSB (Pasta de trabalho binária do Excel)
Converter DOCs para XLSM (Planilha habilitada para macro)
Converter DOCs para XLSX (Abra a pasta de trabalho XML)
Converter DOCs para XLT (Modelo Excel 97 - 2003)
Converter DOCs para XLTM (Modelo habilitado para macro do Excel)
Converter DOCs para XLTX (Modelo do Excel)

O que é DOC Formato de Arquivo

O Microsoft Word Binary File Format (DOC) é um formato de arquivo de documento proprietário empregado pelo Microsoft Office Word. Representa uma estrutura de documento independente de qualquer arquitetura de computador ou sistema operacional específico. O formato DOC serve como um arquivo contêiner, utilizando um formato binário para armazenar vários tipos de dados, incluindo texto formatado, imagens, gráficos e muito mais. A natureza binária do formato DOC o torna não legível por humanos, mas existem vários programas, como o Microsoft Word e o LibreOffice, que podem ler e gravar em arquivos DOC.

O formato DOC foi inicialmente introduzido no Word para Windows 2.0 em 1987. Ele passou por várias revisões desde então, com a iteração mais recente sendo o formato Office Open XML introduzido no Office 2007. Uma das principais vantagens do formato DOC reside em sua compatibilidade com o Microsoft Word , um dos aplicativos de processamento de texto mais utilizados globalmente. Essa compatibilidade permite que os usuários criem e modifiquem documentos usando o Microsoft Word e os compartilhem convenientemente com outras pessoas que também utilizam o aplicativo. Além disso, muitos outros aplicativos de processamento de texto possuem a capacidade de ler e gravar no formato DOC, tornando-o uma escolha versátil para fins de compartilhamento de documentos.

A ampla adoção do formato DOC decorre de sua integração com o Microsoft Word , fornecendo aos usuários um ambiente robusto e rico em recursos para criar e gerenciar documentos. A flexibilidade do formato vai além do Microsoft Word, permitindo que os usuários trabalhem com arquivos DOC usando um software alternativo de processamento de texto. Essa versatilidade garante colaboração contínua de documentos e intercambiabilidade entre os usuários, independentemente do aplicativo de processamento de texto escolhido.

O que é MHTML Formato de Arquivo

MHTML, abreviação de MIME HTML, é um formato de arquivo que combina o código HTML e seus recursos associados em um único arquivo. Significa Multipurpose Internet Mail Extension HTML. Os arquivos MHTML são comumente usados para salvar páginas da Web, incluindo todo o seu conteúdo, como imagens, folhas de estilo CSS e JavaScript, em um único arquivo.

Arquivos MHTML geralmente são criados por navegadores da Web quando os usuários salvam páginas da Web para off-line fins de visualização ou arquivamento. Ao agrupar todos os recursos necessários em um único arquivo, o MHTML garante que a página da Web possa ser visualizada e renderizada com precisão, mesmo sem uma conexão com a Internet ou acesso ao servidor original.

O formato MHTML segue o padrão MIME, que é usado para codificar e trocar vários tipos de dados pela Internet. Ele usa codificação MIME multiparte para empacotar o código HTML e os recursos associados em um único arquivo. O arquivo geralmente tem uma extensão de arquivo .mht ou .mhtml.

Arquivos MHTML podem ser abertos e visualizados por navegadores da Web que suportam o formato, como Internet Explorer, Microsoft Edge e Opera. Alguns editores de texto e softwares especializados também oferecem a capacidade de abrir e editar arquivos MHTML.

O formato MHTML oferece vantagens em termos de portabilidade e conveniência, pois permite que os usuários salvem e compartilhem páginas da Web como um único arquivo, garantindo a preservação do layout da página, formatação e recursos vinculados. No entanto, vale a pena notar que o MHTML não é tão amplamente usado quanto outros formatos da Web, como HTML ou PDF, e a compatibilidade pode variar entre diferentes softwares e plataformas.