Divida HTML em partes em Python

Biblioteca Python rápida para dividir um HTML arquivo em um grupo de arquivos menores de acordo com os critérios fornecidos

Use a Python via .NET biblioteca para dividir HTML arquivos em partes. Você pode integrar as páginas HTML extraídas com outros dados e, como resultado, obter documentos do formulário e do conteúdo que desejar. Dividir HTML em partes facilita a colaboração em HTML arquivos.

Ver trecho de código

Dividir HTML usando Python

Esta biblioteca de software fornece aos desenvolvedores Python um conjunto de funções para dividir os HTML arquivos em partes. A divisão de um HTML em arquivos separados pode ser usada para facilitar o trabalho com seções de um documento em paralelo. Por exemplo, se várias pessoas estiverem trabalhando em um HTML ao mesmo tempo, dividir HTML permitirá que eles acelerem o trabalho. A divisão HTML pode ser parte de uma tecnologia para extrair texto de HTML arquivos e integrar dados em sistemas de informação automatizados ou bancos de dados.

Nossa biblioteca fornece aos desenvolvedores Python todas as funções necessárias para dividir HTML em partes e extrair páginas de acordo com o modo especificado. Esta é uma solução Python via .NET que não precisa do Microsoft Word, Acrobat Reader ou outros aplicativos instalados.

Divida um HTML arquivo em partes no Python código

Divida o conteúdo HTML usando critérios diferentes no Python código. Você pode usar os seguintes modos de extração de página para HTML arquivos: 'dividir por títulos', 'dividir por seções', 'dividir página por página', 'dividir por intervalos de página'.

Depois de dividir seu HTML arquivo em partes, você pode exportar o resultado para o formato de arquivo necessário usando o método 'Document.Save'. Você também pode controlar como as partes HTML são exportadas para HTML ou EPUB usando a propriedade 'DocumentPartSavingCallback', que permitirá redirecionar os fluxos de saída.

Divida HTML documentos facilmente com nossa solução para Python via .NET. O exemplo a seguir mostra como dividir um HTML usando Python:

Python exemplo de código para dividir um HTML arquivo
Faça upload de um arquivo que você deseja dividir
Código de execução
Selecione o formato de destino na lista
pip install aspose-words
Cópia de
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Código de execução

Como dividir HTML em Python

  1. Instale a Python biblioteca para dividir HTML arquivos programaticamente.
  2. Adicione uma referência de biblioteca (importe a biblioteca) ao seu projeto Python.
  3. Abra o HTML em Python.
  4. Chame o método extract_pages() para extrair páginas específicas de HTML.
  5. Obtenha o resultado da divisão de HTML como arquivos separados.

Python biblioteca para dividir HTML documentos

Hospedamos nossos pacotes Python em repositórios PyPi. Siga as instruções passo a passo sobre como instalar o "Aspose.Words for Python via .NET" em seu ambiente de desenvolvedor.

Requisitos de sistema

Este pacote é compatível com Python ≥3.5 e <3.12. Se você desenvolve software para Linux, consulte os requisitos adicionais para gcc e libpython na documentação do produto.

Outras operações de divisão de HTML compatíveis

Você também pode dividir HTML em outros formatos de arquivo:

5%

Inscreva-se para receber atualizações do produto Aspose

Receba boletins e ofertas mensais diretamente em sua caixa de correio.

© Aspose Pty Ltd 2001-2024. Todos os direitos reservados.