Como funciona a mesclagem de HTML no Aspose.HTML for Java
A fusão de HTML em Aspose.HTML for Java é implementada como renderização sequencial de vários documentos HTML num único ficheiro de saída. Cada documento HTML é processado de forma independente e renderizado em ordem no mesmo dispositivo de saída (PDF, DOCX, XPS ou formatos de imagem).
Fusão HTML online
A Online HTML Merger permite-lhe fundir vários ficheiros HTML num único documento em tempo real, diretamente no seu browser. Carregue os ficheiros HTML a partir do sistema de ficheiros local ou de um URL, selecione o formato de saída pretendido e execute o exemplo! É rápido, fácil, seguro e totalmente gratuito! Obterá imediatamente o resultado como um ficheiro separado. Por isso, junte rapidamente ficheiros HTML e guarde o resultado em formato PDF, XPS, DOCX, TIFF ou MHTML online!
// Load HTML documents from files
HTMLDocument document1 = new HTMLDocument("input1.html");
HTMLDocument document2 = new HTMLDocument("input2.html");
HTMLDocument document3 = new HTMLDocument("input3.html");
// Create an instance of HTML Renderer
HtmlRenderer renderer = new HtmlRenderer();
// Create an instance of PdfDevice
PdfDevice device = new PdfDevice("output.pdf");
// Merge HTML documents into a single PDF
renderer.render(device, new HTMLDocument[]{document1, document2, document3});
Passos para fundir ficheiros HTML em Java
Consulte o exemplo acima se desejar mesclar HTML de forma programática. Aspose.HTML for Java processa vários documentos HTML usando um pipeline de renderização:
- Carregue arquivos HTML utilizando
HTMLDocument. Cada arquivo HTML é carregado como um documento separado e analisado em seu próprio DOM. Todos os recursos, como estilos, imagens e fontes, são resolvidos independentemente, de modo que cada documento permanece totalmente isolado nesta fase. - Crie o
HtmlRenderer. O renderizador inicializa o mecanismo de processamento responsável pela conversão de árvores DOM em uma saída visual. Ele controla a renderização, mas não mescla ou modifica a estrutura do documento. - Selecione o dispositivo de saída (PDF, DOCX, XPS, Image). O dispositivo de saída define o formato de destino e controla a forma como o conteúdo processado é serializado.
- Passe múltiplos documentos para
render(). Todos os documentos são processados sequencialmente. Cada DOM é processado independentemente, e a saída resultante é escrita num único fluxo contínuo gerido pelo dispositivo selecionado. - Gere um único ficheiro de saída combinado. O resultado final é um ficheiro de saída onde todos os documentos aparecem em sequência de acordo com a sua ordem de entrada.
Como funciona a renderização de vários documentos HTML
A API Aspose.HTML for Java fornece a classe Renderer para renderizar e mesclar documentos HTML. Usando as instâncias do Renderer diretamente, é possível enviar vários arquivos para o dispositivo de renderização de saída de uma só vez. Aspose.HTML for Java usa um modelo de pipeline de renderização em que cada documento é processado independentemente e gravado em um dispositivo de saída compartilhado.
- Renderizadores suportados: HtmlRenderer , SvgRenderer , MhtmlRenderer , e EpubRenderer , que são utilizados para renderizar documentos HTML, SVG, MHTML e EPUB, respetivamente.
- Dispositivos de saída suportados: PdfDevice, XpsDevice, DocDevice e ImageDevice. Cada dispositivo define o formato de saída final.
Comece a utilizar a biblioteca Aspose.HTML for Java
Aspose.HTML for Java é uma biblioteca avançada para web scraping e análise de HTML. Permite criar e editar ficheiros, navegar dentro de ficheiros, extrair dados e converter ficheiros HTML, XHTML e MHTML em PDFs, imagens e outros formatos. Além disso, ele também lida com CSS, HTML Canvas, SVG, XPath e JavaScript pronto para uso para estender as tarefas de manipulação. É uma API independente e não requer nenhuma instalação de software.
Você pode baixar sua versão mais recente diretamente do
Aspose Maven Repository
e instalá-lo em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml.
Repositório
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Dependência
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>version of aspose-html API</version>
<classifier>jdk17</classifier>
</dependency>
Perguntas mais frequentes
1. O que significa ‘Mesclar HTML’ no Aspose.HTML for Java?
Mesclar HTML significa renderizar vários documentos HTML sequencialmente em um único arquivo de saída usando o pipeline de renderização.
2. O ‘Mesclar HTML’ é uma operação no nível do DOM?
Não. Os documentos HTML não são mesclados em um único DOM. Cada documento é processado independentemente e renderizado em uma saída compartilhada.
3. Posso controlar a ordem dos arquivos HTML mesclados?
Sim. A ordem dos documentos na matriz de entrada define a sequência final de saída.
4. Posso modificar o HTML antes de o fundir?
Sim. Cada documento HTML pode ser modificado usando a API DOM antes de ser renderizado.
5. Os estilos são preservados durante a mesclagem de HTML?
Sim. Cada documento é renderizado com seus próprios estilos, mas a consistência visual depende de como os estilos são definidos entre os documentos.
6. Que formatos são suportados para a saída do Merge HTML?
O Merge HTML suporta PDF, DOCX, XPS e formatos de imagem como PNG, JPEG e TIFF através de dispositivos de renderização.