Aspose.HTML for Java ist eine leistungsstarke HTML-Manipulations-API, mit der Entwickler HTML-Dokumente in Java-Anwendungen erstellen, bearbeiten, parsen und konvertieren können. Die API ermöglicht das Hinzufügen, Löschen und Ersetzen von Knoten, das Extrahieren von CSS-Stilen und die Navigation durch Dokumente mithilfe von XPath, CSS-Selektoren oder DOM-Methoden. Sie unterstützt das Laden von EPUB- und MHTML-Formaten und bietet JavaScript-DOM-Manipulationsmöglichkeiten.
Mit Aspose.HTML for Java können Sie HTML-Dokumente in PDF-, XPS-, DOCX- und Rasterbildformate (JPEG, PNG, BMP, GIF, TIFF) konvertieren, ohne externe Software oder Abhängigkeiten zu benötigen. Die API bietet auch PDF-Verschlüsselung und anpassbare PageSetup-Optionen.

Erweiterte Java-HTML-Verarbeitungs-API-Funktionen

 

API-Funktionen in der Dokumentation

Sie können die vollständige Liste der Aspose.HTML-Funktionen in unserer Dokumentation einsehen. Mit der Aspose.HTML for Java-Bibliothek in Ihrem Projekt können Sie die folgenden Aufgaben ausführen:


Konvertieren von HTML in PDF und XPS

Die API unterstützt das Rendern von HTML in eine Vielzahl beliebter Formate einschließlich PDF, XPS, DOCX, MHTML, Markdown und Bildformate. Entwickler können anpassen, indem sie PageSetup-Aspekte für die resultierenden Formate mit festem Layout konfigurieren, einschließlich der zu rendernden Seitenzahlen, der resultierenden Seitengröße oder der Einstellung der JPEG-Komprimierung für die eingebetteten Bilder.

Rendern Sie HTML als Formate mit festem Layout – Java


// Load HTML document from file
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();

renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);

Umwandlung in Rasterbilder

Aspose.HTML for Java verfügt über eine High-Fidelity-Rendering-Engine, die HTML-Seiten in die am häufigsten verwendeten Rasterbildformate einschließlich TIFF, GIF, BMP, PNG und JPEG konvertieren kann, ohne dass zusätzliche Software oder Tools erforderlich sind.

Konvertieren Sie HTML in PNG mit Aspose.HTML for Java


// Initialize an HTML document from a file
HTMLDocument document = new HTMLDocument("document.html");

// Initialize ImageSaveOptions
ImageSaveOptions options = new ImageSaveOptions(ImageFormat.Png);

// Convert HTML to PNG
Converter.convertHTML(document, options, "document-output.png");

Sie können den online HTML-Konverter ausprobieren.

Sie können auch HTML, XHTML, MHTML, Markdown, EPUB oder SVG in viele andere Dateiformate konvertieren, darunter einige, die unten aufgeführt sind:


Bearbeiten von EPUB- und MHTML-Dateien

Die Bibliothek kann EPUB- und MHTML-Dateien laden, um verschiedene Vorgänge auszuführen, einschließlich der Konvertierung in Formate mit festem Layout und Rasterbild.

Konvertieren Sie MHTML in PDF mit Aspose.HTML for Java


// Open an existing MHTML file for reading
java.io.FileInputStream fileInputStream = new java.io.FileInputStream("sample.mht");

// Create an instance of the PdfSaveOptions class
PdfSaveOptions options = new PdfSaveOptions();

// Call the convertMHTML() method to convert MHTML to PDF
Converter.convertMHTML(fileInputStream, options, "sample-output.pdf");

HTML-Knoten-Navigation

Die API unterstützt die Navigation durch HTML-Dokumente mithilfe von XPath, CSS-Selektoren oder DOM-Methoden. Sie können Knoten im Dokumentbaum einfach einfügen, extrahieren, entfernen oder ersetzen.

Extrahieren Sie alle Anker-Knoten aus dem HTML-Dokument


// Instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

// Get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

// Display anchor text & href values for all nodes
for (Node node : nodelist){

    HTMLAnchorElement anchor = (HTMLAnchorElement)node;
    System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}

Sandkasten konfigurieren

Mit der HTML-API können Sie eine Dokument-Sandbox konfigurieren, die die Verarbeitung von HTML-Dokumenten beeinflusst. Die CSS-Stile sind in einigen Fällen abhängig von der Bildschirmgröße.

Deaktivieren Sie Skripte für die HTML-zu-PDF-Konvertierung mit Java


// Prepare HTML code and save it to a file
String code = "Hello, World!!\n" +
        "\n";

try (java.io.FileWriter fileWriter = new java.io.FileWriter("sandboxing.html")) {
    fileWriter.write(code);
}

// Create an instance of the Configuration class
Configuration configuration = new Configuration();

// Mark 'scripts' as an untrusted resource
configuration.setSecurity(com.aspose.html.Sandbox.Scripts);

// Initialize an HTML document with specified configuration
HTMLDocument document = new HTMLDocument("sandboxing.html", configuration);

// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "sandboxing_out.pdf");

FAQ

1. Was ist Aspose.HTML for Java?

Aspose.HTML for Java ist eine Klassenbibliothek, mit der Entwickler HTML-Dokumente innerhalb ihrer Java-Anwendungen bearbeiten und konvertieren können, ohne externe Tools oder zusätzliche Software zu benötigen.

2. Welches Problem löst Aspose.HTML for Java auf API-Ebene?

Aspose.HTML for Java stellt eine programmierbare HTML-Verarbeitungs-Engine bereit, mit der Sie HTML-Dokumente laden, parsen, modifizieren, rendern und konvertieren können, ohne auf eine Browserlaufzeit angewiesen zu sein. Sie arbeiten direkt mit einem strukturierten DOM, einer Rendering-Pipeline und einer Konvertierungsschicht über Java-APIs, wodurch das Verhalten deterministisch und für Backend-Systeme geeignet ist.

3. Wie wird HTML intern geparst und entspricht es modernen Standards?

Der Parser ist an WHATWG- und W3C-Spezifikationen ausgerichtet, was bedeutet, dass fehlerhaftes Markup, implizite Tags und Kodierungsregeln gemäß modernen Webstandards verarbeitet werden. Das resultierende Dokument wird als vollständig navigierbares DOM bereitgestellt, was für Aufgaben wie Transformation, Validierung und Rendering wichtig ist.

4. Ist es möglich, strukturierte Daten aus HTML mithilfe der API zu extrahieren?

Ja. Da das Dokument als vollständiges DOM dargestellt wird, können Sie es mit Selektoren oder Traversierungs-APIs abfragen und gezielt Elemente, Attribute oder Textknoten extrahieren. Das ist besonders nützlich, wenn HTML eher als Datenquelle und nicht nur als visuelles Dokument dient.

5. Kann die API auch mit anderen Formaten als HTML arbeiten?

Ja, jedoch werden nicht alle Formate auf die gleiche Weise verarbeitet. Aspose.HTML for Java kann Formate wie XHTML, MHTML, SVG, EPUB und Markdown laden und verarbeiten, aber sie werden nicht alle als gleichwertige HTML-Dokumente behandelt. Für einige sind spezielle Ladeverfahren erforderlich oder sie werden nur für bestimmte Operationen unterstützt, beispielsweise für die Konvertierung statt für vollständige Bearbeitung.
In der Praxis bleibt HTML das zentrale Arbeitsformat, während andere Formate typischerweise als Eingabequellen oder Konvertierungsziele innerhalb derselben Verarbeitungspipeline verwendet werden.




  
  

Aspose.HTML bietet individuelle HTML-Verarbeitungs-APIs für andere beliebte Entwicklungsumgebungen, wie unten aufgeführt: