Aspose.HTML for Java adalah API manipulasi HTML lanjutan untuk memanipulasi dan menghasilkan HTML dalam aplikasi Java. API memungkinkan untuk menambah, menghapus, mengganti node, mengekstrak CSS, dan menavigasi dokumen melalui berbagai cara. Selain itu, API menyediakan kemampuan untuk memuat EPUB dan MHTML serta menawarkan pembuatan skrip yang memungkinkan manipulasi DOM melalui JavaScript.
Aspose.HTML for Java mendukung konversi format antar file untuk memuat dokumen HTML dan menyimpan hasilnya dalam XPS, PDF, dan gambar raster termasuk JPEG, PNG, BMP, dan lainnya serta menyediakan enkripsi untuk file PDF.

Fitur API Pemrosesan HTML Java Tingkat Lanjut

 

Fitur API dalam Dokumentasi

Anda dapat melihat daftar lengkap fitur Aspose.HTML di dokumentasi kami. Menggunakan pustaka Aspose.HTML for Java di proyek Anda memungkinkan Anda melakukan tugas-tugas berikut:

  • Membuat atau membuka dokumen HTML yang sudah ada dari berbagai sumber.
  • Manipulasi HTML: membuat, mengedit, menghapus, dan mengganti node HTML melalui API.
  • Menyimpan dokumen HTML.
  • Mengekstraksi gaya CSS untuk node HTML tertentu.
  • Mengonfigurasi kotak pasir dokumen yang memengaruhi pemrosesan dokumen HTML.
  • Navigasi melalui dokumen HTML dengan berbagai cara.
  • Mengubah dokumen HTML menjadi berbagai format yang didukung: JPEG, PNG, BMP, TIFF, PDF, XPS, dan lainnya.

Konversi HTML ke Format PDF dan XPS

API mendukung rendering HTML ke gambar raster yang paling umum digunakan termasuk format BMP, TIFF, JPEG, & PNG, PDF, dan XPS. Pengembang dapat menyesuaikan dengan mengonfigurasi aspek PageSetup untuk format tata letak tetap yang dihasilkan termasuk nomor halaman yang akan dirender, ukuran halaman yang dihasilkan, atau menyetel kompresi JPEG untuk gambar yang disematkan.

Render HTML sebagai format tata letak tetap – Java


// Load HTML document from file
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();

renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);

Konversi ke Gambar Raster

Aspose.HTML for Java menawarkan mesin rendering fidelitas tinggi pada intinya yang dapat mengonversi halaman HTML ke format gambar raster yang paling umum digunakan termasuk TIFF, BMP, PNG & JPEG tanpa memerlukan perangkat lunak atau alat tambahan apa pun.

Konversi HTML ke PNG menggunakan Aspose.HTML for Java


// Initialize an HTML document from a file
HTMLDocument document = new HTMLDocument("document.html");

// Initialize ImageSaveOptions
ImageSaveOptions options = new ImageSaveOptions(ImageFormat.Png);

// Convert HTML to PNG
Converter.convertHTML(document, options, "document-output.png");

Anda dapat mencoba Konverter HTML online.

Anda juga dapat mengonversi HTML, XHTML, MHTML, Markdown, EPUB, atau SVG ke banyak format file lain termasuk beberapa yang tercantum di bawah ini:


Memanipulasi file EPUB dan MHTML

Pustaka ini mampu memuat file EPUB dan MHTML untuk melakukan berbagai operasi termasuk konversi ke tata letak tetap dan format gambar raster.

Konversi MHTML ke PDF menggunakan Aspose.HTML for Java


// Open an existing MHTML file for reading
java.io.FileInputStream fileInputStream = new java.io.FileInputStream("sample.mht");

// Create an instance of the PdfSaveOptions class
PdfSaveOptions options = new PdfSaveOptions();

// Call the convertMHTML() method to convert MHTML to PDF
Converter.convertMHTML(fileInputStream, options, "sample-output.pdf");

Navigasi Node HTML

API mendukung navigasi melalui file HTML baik dengan XPath, elemen, atau kueri pemilih CSS dan seseorang dapat menyisipkan, mengekstrak, menghapus, atau mengganti node dengan mudah.

Ekstrak semua node bertipe anchor – Java


// Instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

// Get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

// Display anchor text & href values for all nodes
for (Node node : nodelist){

    HTMLAnchorElement anchor = (HTMLAnchorElement)node;
    System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}

Konfigurasi Kotak Pasir

API HTML memungkinkan Anda mengonfigurasi kotak pasir dokumen yang memengaruhi pemrosesan dokumen HTML, yaitu; gaya CSS dalam beberapa kasus bergantung pada ukuran layar.

Nonaktifkan skrip untuk konversi HTML ke PDF menggunakan Java


// Prepare HTML code and save it to a file
String code = "Hello, World!!\n" +
        "\n";

try (java.io.FileWriter fileWriter = new java.io.FileWriter("sandboxing.html")) {
    fileWriter.write(code);
}

// Create an instance of the Configuration class
Configuration configuration = new Configuration();

// Mark 'scripts' as an untrusted resource
configuration.setSecurity(com.aspose.html.Sandbox.Scripts);

// Initialize an HTML document with specified configuration
HTMLDocument document = new HTMLDocument("sandboxing.html", configuration);

// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "sandboxing_out.pdf");

FAQ

1. Apa itu Aspose.HTML for Java?

Aspose.HTML for Java adalah pustaka kelas yang memungkinkan pengembang untuk memanipulasi dan mengonversi dokumen HTML dalam aplikasi Java mereka tanpa memerlukan alat atau perangkat lunak eksternal.

2. Masalah apa yang diselesaikan Aspose.HTML for Java pada tingkat API?

Aspose.HTML for Java menyediakan mesin pemrosesan HTML yang dapat diprogram yang memungkinkan Anda memuat, mem-parsing, memodifikasi, merender, dan mengonversi dokumen HTML tanpa bergantung pada runtime browser. Anda berinteraksi langsung dengan DOM terstruktur, pipeline rendering, dan lapisan konversi melalui API Java, sehingga perilakunya bersifat deterministik dan cocok untuk sistem backend.

3. Bagaimana HTML di-parse secara internal, dan apakah sesuai dengan standar modern?

Parser ini selaras dengan spesifikasi WHATWG dan W3C, yang berarti dapat menangani markup yang tidak valid, tag implisit, dan aturan encoding sesuai standar web modern. Dokumen yang dihasilkan diekspos sebagai DOM yang sepenuhnya dapat dinavigasi, yang penting untuk tugas seperti transformasi, validasi, dan rendering.

4. Apakah mungkin mengekstrak data terstruktur dari HTML menggunakan API?

Ya. Karena dokumen direpresentasikan sebagai DOM penuh, Anda dapat melakukan query menggunakan selector atau API traversal untuk mengekstrak elemen tertentu, atribut, atau node teks. Ini sangat berguna ketika HTML digunakan sebagai wadah data, bukan hanya sebagai dokumen visual.

5. Apakah API dapat bekerja dengan format selain HTML?

Ya, tetapi tidak semua format ditangani dengan cara yang sama. Aspose.HTML for Java dapat memuat dan memproses format seperti XHTML, MHTML, SVG, EPUB, dan Markdown, tetapi tidak semuanya diperlakukan sebagai dokumen HTML yang setara. Beberapa memerlukan metode pemuatan khusus atau hanya didukung untuk operasi tertentu, seperti konversi daripada pengeditan penuh.
Dalam praktiknya, HTML tetap menjadi format kerja utama, sementara format lain biasanya digunakan sebagai sumber input atau target konversi dalam pipeline pemrosesan yang sama.




  

Support and Learning Resources

  
  

Aspose.HTML menawarkan API pemrosesan HTML individu untuk lingkungan pengembangan populer lainnya seperti yang tercantum di bawah ini: