Converta PDF para HTML via Python

Conversão de PDF para HTML em Python. Os programadores podem usar esse código de exemplo para exportar PDF para HTML em qualquer arquivo.NET Framework, .NET Core e PHP, VBScript, C++ via COM Interop.

Converta PDF em HTML em Python for .NET

Como converter PDF em HTML? Você pode facilmente converter programaticamente um documento do formato PDF para o formato HTML com uma API Python moderna de processamento de documentos. Use apenas algumas linhas de código para converter arquivos com alta qualidade. A biblioteca Aspose.PDF permitirá que qualquer desenvolvedor resolva facilmente as tarefas de conversão de PDF em HTML usando Python.

Para obter uma descrição mais detalhada do trecho de código e de outros formatos de conversão possíveis, consulte as páginas Documentação. Além disso, você pode verificar as outras conversões de formatos, que são compatíveis com nossa biblioteca.

Com a biblioteca Aspose.PDF for .NET, você pode converter PDF em HTML programaticamente. O software de PDF da Aspose é ideal para indivíduos, pequenas ou grandes empresas. Como é capaz de processar uma grande quantidade de informações, realize a conversão com rapidez e eficiência e proteja seus dados. Um recurso peculiar do Aspose.PDF é uma API para converter PDF em HTML. A característica dessa abordagem é que você só precisa abrir o gerenciador de pacotes NuGet, pesquisar por ‘Aspose.PDF para .NET’ e instalá-lo sem nenhuma configuração especial complexa. (Use o comando do console do Gerenciador de Pacotes para instalar). Para verificar os benefícios da biblioteca, tente usar o trecho de código de conversão PDF para HTML. Você também pode usar o seguinte comando no console do Gerenciador de Pacotes:

Python Package Manager Console

pip install aspose-pdf

Como converter PDF em HTML


Python for .NET desenvolvedores podem facilmente carregar e converter PDF arquivos para HTML em apenas algumas linhas de código.

  1. Adicionar namespace na classe relevante
  2. Inicializar um novo documento
  3. Chame o método Document.Save ao passar o caminho do arquivo de saída & SaveFormat.Html como parâmetros
  4. Finalmente, salve o arquivo HTML de saída

Aqui está um exemplo que demonstra como converter PDF em HTML em Python. Você pode seguir estas etapas fáceis para converter seu arquivo PDF para o formato HTML. Primeiro, faça o upload do arquivo PDF e depois simplesmente salve-o como um arquivo HTML. Você pode usar nomes de arquivo totalmente qualificados para leitura de PDF e para escrever HTML. O conteúdo e a formatação de saída HTML serão idênticos ao documento original PDF.

Exemplo: converter PDF em HTML via Python

Esse código de exemplo mostra a conversão de PDF para HTML Python

Input file:

File not added

Output format:

HTML

Output file:

    def convert_PDF_to_HTML(self, infile, outfile):
        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # Open PDF document

        document = Document(path_infile)

        # save document in HTML format

        save_options = HtmlSaveOptions()
        
        document.Save(path_outfile, save_options)

Biblioteca Python for .NET para converter PDF em HTML

O Aspose.PDF para Python via API.NET suporta os padrões de PDF e as especificações de PDF mais estabelecidos. Ele permite que os desenvolvedores insiram tabelas, gráficos, imagens, hiperlinks, fontes personalizadas e muito mais em documentos PDF. Além disso, também é possível compactar documentos PDF. O Aspose.PDF para Python via .NET fornece excelentes recursos de segurança para desenvolver documentos PDF seguros. Alguns dos principais recursos do Aspose.PDF para Python via API.NET incluem:

  • Capacidade de ler e exportar PDF em vários formatos de imagem, incluindo BMP, GIF, JPEG e PNG.
  • Defina informações básicas (por exemplo, autor, criador) do documento PDF.
  • Recursos de conversão: converta PDF em Word, Excel e PowerPoint. Converta PDF em formatos de imagens. Converta arquivos PDF em formato HTML e vice-versa. Converta PDF em EPUB, texto, XPS, etc.

Você pode encontrar mais informações sobre o Aspose.PDF para Python por meio da API.NET em nossa documentação sobre como usar a API.