Dividir documentos em partes em Python

Biblioteca Python rápida para dividir um documento em um grupo de arquivos menores de acordo com os critérios fornecidos

Use a Python biblioteca para dividir documentos em partes. Você pode integrar as páginas extraídas com outros dados e, como resultado, obter documentos do formulário e do conteúdo que desejar. A divisão de documentos em partes facilita a colaboração neles.

Ver trecho de código

Dividir Word, PDF usando Python

Esta biblioteca de software fornece aos desenvolvedores Python um conjunto de funções para dividir Word documentos, PDF, EPUB, HTML, DOCX em partes. A divisão de texto em arquivos separados pode ser usada para facilitar o trabalho com seções de documentos. O procedimento de divisão de documentos pode fazer parte da tecnologia de integração de dados em sistemas de informação automatizados ou bancos de dados.

Nossa biblioteca fornece aos desenvolvedores do Python todas as funções necessárias para documentos e extração de páginas de documentos de acordo com o modo especificado. Esta é uma solução Python via .NET que não precisa do Microsoft Word, Acrobat Reader ou outros aplicativos instalados.

Divida um documento em partes usando Python

Divida o conteúdo do documento usando critérios diferentes no Python código. Você pode usar os seguintes modos de extração de página: 'dividir por títulos', 'dividir por seções', 'dividir página por página', 'dividir por intervalos de páginas'.

Depois de dividir o documento, você pode exportar o resultado para o formato de arquivo necessário usando o método 'Document.Save'. Você também pode controlar como as partes do documento são exportadas para os HTML formatos ou EPUB usando a propriedade 'DocumentPartSavingCallback', que permitirá redirecionar os fluxos de saída.

Divida documentos facilmente com nossa solução para Python via .NET. O exemplo a seguir mostra como dividir um documento usando Python:

Exemplo de código em Python para dividir um documento em partes
Faça upload de um arquivo que você deseja dividir
Código de execução
Selecione o formato de destino na lista
pip install aspose-words
Cópia de
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Código de execução

Como dividir Word, PDF, HTML e outros formatos de arquivo em Python

  1. Instale a Python biblioteca para dividir documentos programaticamente.
  2. Adicione uma referência de biblioteca (importe a biblioteca) ao seu projeto Python.
  3. Abra o documento de origem em Python.
  4. Chame o método extract_pages() para extrair páginas específicas do seu documento.
  5. Obtenha o resultado da divisão de documentos como arquivos separados.

Python biblioteca para dividir arquivos

Hospedamos nossos pacotes Python em repositórios PyPi. Siga as instruções passo a passo sobre como instalar o "Aspose.Words for Python via .NET" em seu ambiente de desenvolvedor.

Requisitos de sistema

Este pacote é compatível com Python ≥3.5 e <3.12. Se você desenvolve software para Linux, consulte os requisitos adicionais para gcc e libpython na documentação do produto.

Formatos de arquivo mais populares para divisão

5%

Inscreva-se para receber atualizações do produto Aspose

Receba boletins e ofertas mensais diretamente em sua caixa de correio.

© Aspose Pty Ltd 2001-2024. Todos os direitos reservados.