Aspose.HTML for Java – це розширений API для обробки HTML для аналізу та генерування HTML у програмах Java. API дозволяє додавати, видаляти, замінювати вузли, видобувати CSS і переміщатися по документу різними способами. Крім того, API надає можливості для завантаження EPUB і MHTML, а також пропонує сценарії, які дозволяють маніпулювати DOM на JavaScript.
Aspose.HTML for Java підтримує міжфайлове перетворення форматів для завантаження HTML-документа та збереження результатів у XPS, PDF і растрових зображеннях, включаючи JPEG, PNG, BMP тощо, а також забезпечує шифрування PDF-файлів.
Advanced Java HTML Processing API Features
Впровадити специфікації W3C
Вставити, замінити або видалити вузли
Отримайте інформацію про стилі CSS
Завантажувати формати документів EPUB і MHTML
Перетворення HTML у растрові зображення
Функції API в документації
Ви можете переглянути повний список функцій Aspose.HTML у нашій документації. Використання бібліотеки Aspose.HTML for Java у вашому проекті дозволяє виконувати такі завдання:
- Створення або відкриття існуючого документа HTML з різних джерел.
- Маніпуляції HTML: створення, редагування, видалення та заміна вузлів HTML за допомогою API.
- Збереження документа HTML.
- Вилучення стилів CSS для певного вузла HTML.
- Налаштування пісочниці документів, що впливає на обробку документів HTML.
- Навігація документом HTML різними способами.
- Перетворення документа HTML у різні підтримувані формати: JPEG, PNG, BMP, TIFF, PDF, XPS тощо.
Конвертація HTML у формат PDF і XPS
API підтримує візуалізацію HTML для найбільш часто використовуваних растрових зображень, включаючи формати BMP, TIFF, JPEG і PNG, PDF і XPS. Розробники можуть налаштувати, налаштувавши параметри PageSetup для результуючих форматів фіксованого макета, включаючи номери сторінок, які потрібно відобразити, кінцевий розмір сторінки або налаштування стиснення JPEG для вбудованих зображень.
Візуалізація HTML як форматів із фіксованою розкладкою – Java
// Load HTML document from file
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");
// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();
renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);
Перетворення на растрові зображення
Aspose.HTML for Java пропонує механізм візуалізації з високою точністю, який може конвертувати HTML-сторінки в найбільш часто використовувані формати растрових зображень, включаючи TIFF, BMP, PNG і JPEG, не вимагаючи додаткового програмного забезпечення чи інструментів.
Конвертувати HTML в PNG за допомогою Aspose.HTML for Java
// Initialize an HTML document from a file
HTMLDocument document = new HTMLDocument("document.html");
// Initialize ImageSaveOptions
ImageSaveOptions options = new ImageSaveOptions(ImageFormat.Png);
// Convert HTML to PNG
Converter.convertHTML(document, options, "document-output.png");
Ви можете спробувати онлайн HTML Converter.
Ви також можете конвертувати HTML, XHTML, MHTML, Markdown, EPUB або SVG у багато інших форматів файлів, у тому числі кілька перелічених нижче:
Робота з файлами EPUB і MHTML
Бібліотека здатна завантажувати файли EPUB і MHTML для виконання різних операцій, включаючи перетворення у формати фіксованого макета та растрових зображень.
Конвертувати MHTML в PDF за допомогою Aspose.HTML for Java
// Open an existing MHTML file for reading
java.io.FileInputStream fileInputStream = new java.io.FileInputStream("sample.mht");
// Create an instance of the PdfSaveOptions class
PdfSaveOptions options = new PdfSaveOptions();
// Call the convertMHTML() method to convert MHTML to PDF
Converter.convertMHTML(fileInputStream, options, "sample-output.pdf");
Навігація вузлами HTML
API підтримує навігацію файлом HTML за допомогою XPath, елементів або запитів селектора CSS, і можна легко вставляти, витягувати, видаляти або замінювати вузли.
Витягніть усі вузли типу anchor – Java
// Instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");
// Get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");
// Display anchor text & href values for all nodes
for (Node node : nodelist){
HTMLAnchorElement anchor = (HTMLAnchorElement)node;
System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}
Налаштувати пісочницю
HTML API дає змогу налаштувати пісочницю документів, яка впливає на обробку документів HTML, тобто; стилі CSS у деяких випадках залежать від розміру екрана.
Вимкнути скрипти для конвертації HTML в PDF за допомогою Java
// Prepare HTML code and save it to a file
String code = "Hello, World!!\n" +
"\n";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("sandboxing.html")) {
fileWriter.write(code);
}
// Create an instance of the Configuration class
Configuration configuration = new Configuration();
// Mark 'scripts' as an untrusted resource
configuration.setSecurity(com.aspose.html.Sandbox.Scripts);
// Initialize an HTML document with specified configuration
HTMLDocument document = new HTMLDocument("sandboxing.html", configuration);
// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "sandboxing_out.pdf");
FAQ
1. Що таке Aspose.HTML for Java?
Aspose.HTML for Java – це бібліотека класів, яка дозволяє розробникам маніпулювати та конвертувати HTML-документи у своїх Java-додатках без необхідності використання зовнішніх інструментів або програмного забезпечення.2. Яку проблему вирішує Aspose.HTML for Java на рівні API?
Aspose.HTML for Java надає програмований механізм обробки HTML, який дозволяє завантажувати, парсити, змінювати, рендерити та конвертувати HTML-документи без залежності від браузерного середовища виконання. Ви працюєте безпосередньо зі структурованим DOM, пайплайном рендерингу та шаром конвертації через Java API, що робить поведінку детермінованою та придатною для backend-систем.3. Як HTML обробляється всередині та чи відповідає сучасним стандартам?
Парсер відповідає специфікаціям WHATWG та W3C, що означає обробку некоректної розмітки, неявних тегів і правил кодування відповідно до сучасних веб-стандартів. Отриманий документ представлений як повністю навігабельний DOM, що важливо для завдань трансформації, валідації та рендерингу.4. Чи можна витягувати структуровані дані з HTML за допомогою API?
Так. Оскільки документ представлений у вигляді повного DOM, його можна запитувати за допомогою селекторів або API обходу та витягувати окремі елементи, атрибути або текстові вузли. Це особливо корисно, коли HTML використовується як контейнер даних, а не лише як візуальний документ.5. Чи може API працювати з форматами, відмінними від HTML?
Так, але не всі формати обробляються однаково. Aspose.HTML for Java може завантажувати та обробляти формати XHTML, MHTML, SVG, EPUB і Markdown, однак вони не завжди розглядаються як еквівалентні HTML-документи. Деякі потребують спеціальних методів завантаження або підтримуються лише для окремих операцій, наприклад конвертації, а не повноцінного редагування.На практиці HTML залишається основним робочим форматом, а інші формати зазвичай використовуються як джерела вхідних даних або цілі конвертації в межах одного й того ж процесу обробки.
Support and Learning Resources
- Навчальні ресурси
- Документація
- Вихідний код
- Посилання на API
- Підтримка продукту
- Безкоштовна підтримка
- Платна підтримка
- Блог
- Примітки до випуску
- Чому Aspose.HTML for Java?
- Список клієнтів
- Історії успіху