Transforme MHTML em WORDML via Java

On Premise Java API para renderizar MHTML para WORDML sem usar nenhum aplicativo de terceiros

 

Você pode converter MHTML para WORDML usando duas etapas simples. Primeiro você precisa renderizar o arquivo MHTML para DOC usando Aspose.PDF for Java . Depois disso, usando a poderosa API de processamento de documentos Aspose.Words for Java , você pode converter DOC para WORDML. Ambas as APIs estão no pacote Aspose.Total for Java .

API Java para converter MHTML em WORDML

  1. Abra o arquivo MHTML usando a classe Document
  2. Converta MHTML para DOC usando salvar método
  3. Carregue o arquivo DOC usando a classe Document de Aspose.Words
  4. Salve o documento no formato WORDML usando o método save e defina o WORDML como SalvarFormato

Requisitos de conversão

Você pode facilmente usar o Aspose.Total para Java diretamente de um projeto baseado em Maven e inclua Aspose.PDF for Java e Aspose.Words for Java em seu pom.xml.

Como alternativa, você pode obter um arquivo ZIP em downloads .

// load MHTML file with an instance of Document class
Document document = new Document("template.mhtml");
// save MHTML as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.WORD_ML
outputDocument.save("output.word_ml", SaveFormat.WORD_ML);   

Requisitos de conversão

Ao converter MHTML para WORDML, mesmo que seu documento esteja protegido por senha, você ainda pode abri-lo usando a API de manipulação de PDF Aspose.PDF for Java . Para abrir o arquivo criptografado, você precisa criar um objeto Document e abrir o MHTML usando a senha do proprietário.

// open encrypted document
Document document = new Document("input.mhtml", "password");
// save MHTML as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Abrir documento MHTML protegido por senha via Java

Ao salvar seu documento de entrada no formato de arquivo WORDML, você também pode salvar seu documento no banco de dados em vez de em um sistema de arquivos. Pode ser necessário implementar o armazenamento e a recuperação de objetos Document de e para um banco de dados. Isso seria necessário se você estivesse implementando qualquer tipo de sistema de gerenciamento de conteúdo. Para salvar seu WORDML no banco de dados, muitas vezes é necessário serializar o documento para obter uma matriz de bytes. Isso pode ser feito usando a API Aspose.Words for Java . Depois de obter sua matriz de bytes, você pode armazená-la no banco de dados usando a instrução SQL.

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.WORD_ML);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

Explore MHTML Opções de conversão com Java

Converter MHTMLs para DOCM (Arquivo Marco do Microsoft Word 2007)
Converter MHTMLs para DOT (Arquivos de modelo do Microsoft Word)
Converter MHTMLs para DOTM (Arquivo de modelo do Microsoft Word 2007+)
Converter MHTMLs para DOTX (Arquivo de modelo do Microsoft Word)
Converter MHTMLs para FLATOPC (Microsoft Word 2003 WordprocessingML)
Converter MHTMLs para GIF (Formato de Intercâmbio Gráfico)
Converter MHTMLs para MARKDOWN (Linguagem de Marcação Leve)
Converter MHTMLs para ODT (Formato de Arquivo de Texto OpenDocument)
Converter MHTMLs para OTT (Modelo OpenDocument)
Converter MHTMLs para PCL (Linguagem de Comando da Impressora)
Converter MHTMLs para PS (Arquivo PostScript)
Converter MHTMLs para RTF (Formato de texto rico)
Converter MHTMLs para XAMLFLOW (Power Automate da Microsoft)
Converter MHTMLs para CSV (Valores separados por vírgula)
Converter MHTMLs para DIF (Formato de Intercâmbio de Dados)
Converter MHTMLs para EXCEL (Formatos de arquivo de planilha)
Converter MHTMLs para FODS (Planilha XML Plana OpenDocument)
Converter MHTMLs para MD (Linguagem de Remarcação)
Converter MHTMLs para ODS (Planilha OpenDocument)
Converter MHTMLs para SXC (Planilha do StarOffice Calc)
Converter MHTMLs para TSV (Valores separados por tabulações)
Converter MHTMLs para TXT (Documento de texto)
Converter MHTMLs para XLAM (Suplemento habilitado para macro do Excel)
Converter MHTMLs para XLSB (Pasta de trabalho binária do Excel)
Converter MHTMLs para XLSM (Planilha habilitada para macro)
Converter MHTMLs para XLT (Modelo Excel 97 - 2003)
Converter MHTMLs para XLTM (Modelo habilitado para macro do Excel)
Converter MHTMLs para XLTX (Modelo do Excel)
Converter MHTMLs para APNG (Gráficos Animados de Rede Portátil)
Converter MHTMLs para DICOM (Imagem Digital e Comunicações em Medicina)
Converter MHTMLs para DXF (Formato de troca de desenho da Autodesk)
Converter MHTMLs para EMZ (Metarquivo Aprimorado Compactado do Windows)
Converter MHTMLs para IMAGE (Arquivos de imagem)
Converter MHTMLs para JPEG2000 (Formato de Imagem J2K)
Converter MHTMLs para ODP (Formato de Apresentação OpenDocument)
Converter MHTMLs para OTP (Formato Padrão do OpenDocument)
Converter MHTMLs para POT (Arquivos de modelo do Microsoft PowerPoint)
Converter MHTMLs para POTM (Arquivo de modelo do Microsoft PowerPoint)
Converter MHTMLs para POTX (Modelo de apresentação do Microsoft PowerPoint)
Converter MHTMLs para POWERPOINT (Arquivos de apresentação)