Wandeln Sie PDF über Java in MHTML um

Lokale Java-API zum Rendern von PDF in MHTML ohne Verwendung einer Drittanbieteranwendung

 

Sie können PDF in zwei einfachen Schritten in MHTML konvertieren. Zuerst müssen Sie die PDF-Datei mit Aspose.PDF for Java in DOC rendern. Danach können Sie mit der leistungsstarken Dokumentenverarbeitungs-API Aspose.Words for Java DOC in MHTML konvertieren. Beide APIs befinden sich im Paket Aspose.Total for Java .

Java-API zum Konvertieren von PDF in MHTML

  1. Öffnen Sie die PDF-Datei mit der Klasse Document .
  2. Konvertieren Sie PDF in DOC mit save Methode
  3. Laden Sie die DOC-Datei mithilfe der Klasse Document von Aspose.Words
  4. Speichern Sie das Dokument mit der Methode save im MHTML-Format und legen Sie MHTML fest als SaveFormat

Konvertierungsanforderungen

Sie können Aspose.Total für Java direkt aus einem auf Maven basierenden Projekt verwenden und enthalten Aspose.PDF für Java und Aspose.Words für Java in Ihrer pom.xml.

Alternativ können Sie eine ZIP-Datei von downloads herunterladen.

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.MHTML
outputDocument.save("output.mhtml", SaveFormat.MHTML);   

Konvertierungsanforderungen

Auch wenn Ihr Dokument passwortgeschützt ist, können Sie es während der Konvertierung von PDF in MHTML immer noch mit der PDF-Manipulations-API Aspose.PDF for Java öffnen. Um die verschlüsselte Datei zu öffnen, müssen Sie ein Dokument -Objekt erstellen und das PDF mit dem Passwort des Besitzers öffnen.

// open encrypted document
Document document = new Document("input.pdf", "password");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Öffnen Sie ein passwortgeschütztes PDF-Dokument über Java

Während Sie Ihr Eingabedokument im MHTML-Dateiformat speichern, können Sie Ihr Dokument auch in einer Datenbank statt in einem Dateisystem speichern. Möglicherweise müssen Sie das Speichern und Abrufen von Document-Objekten in und aus einer Datenbank implementieren. Dies wäre erforderlich, wenn Sie ein beliebiges Content-Management-System implementieren. Um Ihr MHTML in der Datenbank zu speichern, ist es oft notwendig, das Dokument zu serialisieren, um ein Byte-Array zu erhalten. Dies kann mit der Aspose.Words for Java -API erfolgen. Nachdem Sie Ihr Byte-Array erhalten haben, können Sie es mit einer SQL-Anweisung in der Datenbank speichern.

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.MHTML);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

Erkunden Sie PDF Konvertierungs optionen mit Java

PDFs in DOCM konvertieren (Microsoft Word 2007 Marco-Datei)
PDFs in DOT konvertieren (Microsoft Word-Vorlagendateien)
PDFs in DOTM konvertieren (Microsoft Word 2007+-Vorlagendatei)
PDFs in DOTX konvertieren (Microsoft Word-Vorlagendatei)
PDFs in FLATOPC konvertieren (Microsoft Word 2003 TextverarbeitungML)
PDFs in GIF konvertieren (Grafisches Austauschformat)
PDFs in MARKDOWN konvertieren (Leichte Auszeichnungssprache)
PDFs in ODT konvertieren (OpenDocument-Textdateiformat)
PDFs in OTT konvertieren (OpenDocument-Vorlage)
PDFs in PCL konvertieren (Druckerbefehlssprache)
PDFs in PS konvertieren (PostScript-Datei)
PDFs in RTF konvertieren (Rich-text-Format)
PDFs in WORDML konvertieren (Microsoft Word 2003 TextverarbeitungML)
PDFs in XAMLFLOW konvertieren (Microsofts Power Automate)
PDFs in CSV konvertieren (Durch Kommas getrennte Werte)
PDFs in DIF konvertieren (Datenaustauschformat)
PDFs in EXCEL konvertieren (Tabellenkalkulationsdateiformate)
PDFs in FODS konvertieren (OpenDocument Flat XML-Tabelle)
PDFs in MD konvertieren (Markdown-Sprache)
PDFs in ODS konvertieren (OpenDocument-Tabelle)
PDFs in SXC konvertieren (StarOffice Calc-Tabelle)
PDFs in TSV konvertieren (Durch Tabulatoren getrennte Werte)
PDFs in TXT konvertieren (Text dokument)
PDFs in XLAM konvertieren (Excel-Makro-fähiges Add-In)
PDFs in XLSB konvertieren (Excel-Binärarbeitsmappe)
PDFs in XLSM konvertieren (Makrofähige Tabellenkalkulation)
PDFs in XLT konvertieren (Excel 97 - 2003-Vorlage)
PDFs in XLTM konvertieren (Excel-Makro-fähige Vorlage)
PDFs in ODP konvertieren (OpenDocument-Präsentationsformat)
PDFs in OTP konvertieren (OpenDocument-Standardformat)
PDFs in POT konvertieren (Microsoft PowerPoint-Vorlagendateien)
PDFs in POTM konvertieren (Microsoft PowerPoint-Vorlagendatei)
PDFs in POTX konvertieren (Microsoft PowerPoint-Vorlagenpräsentation)
PDFs in POWERPOINT konvertieren (Präsentationsdateien)
PDFs in PPS konvertieren (PowerPoint-Diashow)
PDFs in PPSM konvertieren (Makrofähige Diashow)
PDFs in PPSX konvertieren (PowerPoint-Diashow)
PDFs in PPT konvertieren (PowerPoint Präsentation)
PDFs in PPTM konvertieren (Makrofähige Präsentationsdatei)