Divida DOCX em partes em Python

Biblioteca Python rápida para dividir um DOCX arquivo em um grupo de arquivos menores de acordo com os critérios fornecidos

Use a Python via .NET biblioteca para dividir DOCX arquivos em partes. Você pode integrar as páginas DOCX extraídas com outros dados e, como resultado, obter documentos do formulário e do conteúdo que desejar. Dividir DOCX em partes facilita a colaboração em DOCX arquivos.

Ver trecho de código

Dividir DOCX em Python

Esta biblioteca de software fornece aos desenvolvedores Python um conjunto de funções para dividir DOCX arquivos em partes. A divisão de um DOCX documento em arquivos separados pode ser usada para facilitar o trabalho paralelo com seções de um documento. Por exemplo, se várias pessoas estiverem trabalhando em um DOCX documento ao mesmo tempo, dividi-lo permitirá que agilizem o trabalho. A divisão de DOCX documentos pode fazer parte de uma tecnologia para extrair texto de DOCX arquivos e integrar dados em sistemas de informação automatizados ou bancos de dados.

Nossa biblioteca fornece aos desenvolvedores Python todas as funções necessárias para dividir DOCX arquivos em partes e extrair páginas de acordo com o modo especificado. Esta é uma solução Python via .NET independente que não precisa do Microsoft Word, Acrobat Reader ou outros aplicativos instalados.

Divida o DOCX documento em partes usando Python

Divida o conteúdo DOCX usando critérios diferentes no código Python. Você pode usar os seguintes modos de extração de página para DOCX documentos: 'dividir por títulos', 'dividir por seções', 'dividir página por página', 'dividir por intervalos de páginas'.

Depois de dividir seu arquivo DOCX em partes, você pode exportar o resultado para o formato de arquivo necessário usando o método ‘Document.Save’. Você também pode controlar como as partes do documento DOCX são exportadas para HTML ou EPUB usando a propriedade ‘DocumentPartSavingCallback’, que permitirá redirecionar fluxos de saída.

Divida DOCX documentos facilmente com nossa solução para Python via .NET. O exemplo a seguir mostra como dividir um DOCX documento usando Python:

Python exemplo de código para dividir um DOCX arquivo
Faça upload de um arquivo que você deseja dividir
Código de execução
Selecione o formato de destino na lista
pip install aspose-words
Cópia de
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Código de execução

Como dividir DOCX em Python

  1. Instale a Python biblioteca para dividir DOCX arquivos programaticamente.
  2. Adicione uma referência de biblioteca (importe a biblioteca) ao seu projeto Python.
  3. Abra o DOCX em Python.
  4. Chame o método extract_pages() para extrair páginas específicas de DOCX.
  5. Obtenha o resultado da divisão de DOCX como arquivos separados.

Python biblioteca para dividir DOCX documentos

Hospedamos nossos pacotes Python em repositórios PyPi. Siga as instruções passo a passo sobre como instalar o "Aspose.Words for Python via .NET" em seu ambiente de desenvolvedor.

Requisitos de sistema

Este pacote é compatível com Python ≥3.5 e <3.12. Se você desenvolve software para Linux, consulte os requisitos adicionais para gcc e libpython na documentação do produto.

Outras operações de divisão de DOCX compatíveis

Você também pode dividir DOCX em outros formatos de arquivo:

5%

Inscreva-se para receber atualizações do produto Aspose

Receba boletins e ofertas mensais diretamente em sua caixa de correio.

© Aspose Pty Ltd 2001-2024. Todos os direitos reservados.