Converta HTML para TXT via Java

Conversão de HTML para TXT em Java. Os programadores podem usar esse código de exemplo para exportar HTML para TXT em qualquer aplicativo baseado em Java para Web ou desktop.

Converta HTML em TXT em Java

Como converter HTML em TXT? Você pode facilmente converter programaticamente um documento do formato HTML para o formato TXT com uma moderna API Java de processamento de documentos. Use apenas algumas linhas de código Java para converter arquivos com alta qualidade. A biblioteca Aspose.PDF permitirá que qualquer desenvolvedor resolva com eficiência as tarefas de conversão de HTML em TXT usando Java.

Para obter uma descrição mais detalhada do trecho de código e de outros formatos de conversão possíveis, consulte as páginas Documentação. Além disso, você pode verificar as outras conversões de formatos, que são compatíveis com nossa biblioteca.

Para converter HTML em TXT, usaremos a API Aspose.PDF para Java, que é uma API de conversão rica em recursos, poderosa e fácil de usar para a plataforma Java. Você pode baixar a versão mais recente diretamente do Maven e instalá-la em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml. Verifique os detalhes da instalação da biblioteca nas páginas Documentação.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Como converter HTML em TXT


Java desenvolvedores podem facilmente carregar e converter HTML arquivos para TXT em apenas algumas linhas de código.

  1. Carregar arquivo HTML com uma instância de Document
  2. Chame o método Document.Save ao passar o caminho do arquivo de saída & SaveFormat.Txt como parâmetros
  3. O arquivo TXT será salvo no caminho especificado

Aqui está um exemplo que demonstra como converter HTML em TXT em Java. Você pode seguir estas etapas fáceis para converter seu arquivo HTML para o formato TXT. Primeiro, faça o upload do arquivo HTML e depois simplesmente salve-o como um arquivo TXT. Você pode usar nomes de arquivo totalmente qualificados para leitura de HTML e para escrever TXT. O conteúdo e a formatação de saída TXT serão idênticos ao documento original HTML.

Exemplo: converter HTML em TXT via Java

Esse código de exemplo mostra a conversão de HTML para TXT Java

Input file:

File not added

Output format:

TXT

Output file:

        public static void ConvertHTMLtoTXT()
        {
            // load HTML with an instance of Document
            Document document = new Document("template.html", new HtmlLoadOptions());

            // create an object of TextDevice
            var renderer = new Aspose.Pdf.Devices.TextDevice();

            renderer.Process(document.Pages[1], "output.txt");
        }

Biblioteca Java para converter HTML em TXT

A API Aspose.PDF para Java é uma biblioteca que permite aos desenvolvedores adicionar recursos de processamento de PDF aos seus aplicativos. Ele pode ser usado para criar qualquer tipo de aplicativo de 32 e 64 bits para gerar ou ler, converter e manipular arquivos PDF sem o uso do Adobe Acrobat. O Aspose.PDF para Java permite que os desenvolvedores insiram tabelas, gráficos, imagens, hiperlinks, fontes personalizadas e muito mais em documentos PDF. Além disso, também é possível compactar PDF. O Aspose.PDF para Java fornece excelentes recursos de segurança para desenvolver arquivos PDF seguros.

Você pode encontrar mais informações sobre a API Aspose.PDF para Java em documentação e exemplos sobre como usar a API. Alguns dos principais recursos da API Aspose.PDF para Java incluem suporte para vários formatos de arquivo, incluindo HTML, XFA, TXT, PCL, XML, XPS e formatos de arquivo de imagem, suporte para várias versões de PDF e ampla funcionalidade de hiperlinks.