Transformeer MHTML naar MARKDOWN via Java

On Premise Java API om MHTML naar MARKDOWN te renderen zonder een applicatie van derden te gebruiken

 

U kunt MHTML naar MARKDOWN converteren met behulp van twee eenvoudige stappen. Eerst moet u het MHTML-bestand naar DOC renderen met Aspose.PDF for Java . Daarna kunt u met behulp van de krachtige API voor documentverwerking Aspose.Words for Java DOC naar MARKDOWN converteren. Beide API’s vallen onder het pakket Aspose.Total for Java .

Java API om MHTML naar MARKDOWN te converteren

  1. Open het MHTML-bestand met de klasse Document
  2. Converteer MHTML naar DOC met behulp van save methode:
  3. Laad het DOC-bestand met behulp van de Document klasse van Aspose.Words
  4. Sla het document op in MARKDOWN-formaat met behulp van save methode en stel MARKDOWN in als OpslaanFormaat

Conversievereisten

U kunt Aspose.Total voor Java gemakkelijk rechtstreeks vanuit een op Maven gebaseerd project gebruiken en bevatten Aspose.PDF voor Java en Aspose.Words voor Java in uw po.xml.

U kunt ook een ZIP-bestand krijgen van downloads .

// load MHTML file with an instance of Document class
Document document = new Document("template.mhtml");
// save MHTML as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.MARKDOWN
outputDocument.save("output.markdown", SaveFormat.MARKDOWN);   

Conversievereisten

Tijdens het converteren van MHTML naar MARKDOWN kunt u, zelfs als uw document met een wachtwoord is beveiligd, het nog steeds openen met de PDF Manipulation API Aspose.PDF for Java . Om het versleutelde bestand te openen, moet u een Document -object maken en de MHTML openen met het wachtwoord van de eigenaar.

// open encrypted document
Document document = new Document("input.mhtml", "password");
// save MHTML as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Open met een wachtwoord beveiligd MHTML-document via Java

Terwijl u uw invoerdocument opslaat in MARKDOWN-bestandsindeling, kunt u uw document ook opslaan in een database in plaats van in een bestandssysteem. Mogelijk moet u het opslaan en ophalen van documentobjecten van en naar een database implementeren. Dit zou nodig zijn als u een inhoudsbeheersysteem zou implementeren. Om uw MARKDOWN in de database op te slaan, is het vaak nodig om het document te serialiseren om een bytearray te verkrijgen. Dit kan worden gedaan met behulp van Aspose.Words for Java API. Nadat u uw byte-array hebt ontvangen, kunt u deze in de database opslaan met behulp van een SQL-instructie.

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.MARKDOWN);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

Bekijk MHTML conversieopties met Java

MHTMLs converteren naar APNG (Geanimeerde draagbare netwerkafbeeldingen)
MHTMLs converteren naar DICOM (Digitale beeldvorming en communicatie in de geneeskunde)
MHTMLs converteren naar DXF (Autodesk Drawing Exchange-indeling)
MHTMLs converteren naar EMZ (Windows gecomprimeerd verbeterd metabestand)
MHTMLs converteren naar IMAGE (Afbeeldingsbestanden)
MHTMLs converteren naar ODP (OpenDocument-presentatieformaat)
MHTMLs converteren naar OTP (OpenDocument Standaardformaat)
MHTMLs converteren naar POT (Microsoft PowerPoint-sjabloonbestanden)
MHTMLs converteren naar POTM (Microsoft PowerPoint-sjabloonbestand)
MHTMLs converteren naar POTX (Microsoft PowerPoint-sjabloonpresentatie)
MHTMLs converteren naar POWERPOINT (Presentatie bestanden)
MHTMLs converteren naar PPS (PowerPoint-diavoorstelling)
MHTMLs converteren naar PPSM (Diavoorstelling met macro's)
MHTMLs converteren naar PPSX (PowerPoint-diavoorstelling)
MHTMLs converteren naar PPT (PowerPoint presentatie)
MHTMLs converteren naar PPTM (Presentatiebestand met ingeschakelde macro's)
MHTMLs converteren naar PSD (Photoshop-document)
MHTMLs converteren naar SVGZ (Gecomprimeerde schaalbare vectorafbeeldingen)
MHTMLs converteren naar SWF (Shockwave Flash-film)
MHTMLs converteren naar TGA (Truevision grafische adapter)
MHTMLs converteren naar WMF (Windows-metabestand)
MHTMLs converteren naar WMZ (Gecomprimeerd Windows-metabestand)
MHTMLs converteren naar CSV (Door komma's gescheiden waarden)
MHTMLs converteren naar DIF (Formaat voor gegevensuitwisseling)
MHTMLs converteren naar DOCM (Microsoft Word 2007 Marco-bestand)
MHTMLs converteren naar DOT (Microsoft Word-sjabloonbestanden)
MHTMLs converteren naar DOTM (Microsoft Word 2007+ sjabloonbestand)
MHTMLs converteren naar DOTX (Microsoft Word-sjabloonbestand)
MHTMLs converteren naar EXCEL (Spreadsheet-bestandsindelingen)
MHTMLs converteren naar FLATOPC (Microsoft Word 2003 TekstverwerkingML)
MHTMLs converteren naar FODS (OpenDocument platte XML-spreadsheet)
MHTMLs converteren naar GIF (Grafisch uitwisselingsformaat)
MHTMLs converteren naar ODS (OpenDocument-spreadsheet)
MHTMLs converteren naar ODT (OpenDocument Tekstbestandsindeling)
MHTMLs converteren naar OTT (Documentsjabloon openen)
MHTMLs converteren naar PCL (Printeropdrachttaal)
MHTMLs converteren naar PS (PostScript-bestand)