Fractionner le PDF via Aspose.PDF pour Python for .NET

Fractionnement de fichiers à l’aide de Aspose.PDF pour l’outil Python for .NET.

Fractionner des fichiers à l'aide de Aspose.PDF pour Python for .NET

Vous n’avez besoin que d’une partie de vos gros fichiers ? Pour séparer une ou plusieurs parties de votre document, vous devez fractionner les pages du fichier d’origine. Pour fractionner les fichiers, nous utiliserons l’API Aspose.PDF pour Python, une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plateforme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez-le. Notre outil logiciel permet également aux développeurs de diviser les documents Word, PDF, HTML, TXT et DOCX en plusieurs parties. Pour plus de détails, veuillez consulter Pages de documentation. Vous pouvez également utiliser la commande suivante depuis la console Package Manager.

Python Package Manager Console

pip install aspose-pdf

Divisez les documents via Python


Vous devez Aspose.PDF for .NET pour essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un nouvel objet de classe Document pour fractionner les pages PDF.
  3. Ajoute la page actuelle au document.
  4. Enregistrer la page actuelle en tant que PDF séparé

Comment fractionner un PDF à l'aide de Python

La bibliothèque Aspose.PDF pour Python vous permet de diviser des documents PDF volumineux. Le fractionnement d’un document PDF est un cas d’utilisation courant lorsque vous travaillez avec des documents PDF. Il permet de réduire la taille d’un fichier PDF en divisant les documents volumineux en fichiers plus petits à envoyer par e-mail.

PDF divisé - Python

Cet exemple de code montre comment fractionner un fichier PDF - Python

 doc = aspose.pdf.Document("1.pdf")

 pdf_editor = aspose.pdf.PdfFileEditor()
 pdf_editor.Extract(path_source, 1, doc.Pages.Count / 2, "pdf_half.pdf")

Comment diviser des fichiers HTML à l'aide de Python

Les documents HTML peuvent être volumineux car ils peuvent contenir du texte, des images, des graphiques, etc. Il se peut que vous deviez séparer les fichiers HTML en fonction de différentes exigences ou de différents cas d’utilisation. La bibliothèque Aspose.PDF pour Python vous aidera dans cette tâche.

HTML divisé - Python

Cet exemple de code montre comment fractionner un fichier HTML - Python

 doc = aspose.pdf.Document("test.pdf");

 # save input html to pdf to file
 doc = aspose.pdf.Document("1.html", HtmlLoadOptions);
 doc.Save("test.pdf", SaveFormat.PDF);

 # slit first page
 pdf_editor = aspose.pdf.PdfFileEditor();
 pdf_editor.SplitFromFirst("test.pdf", 1, "test.pdf");
 doc.Save("html_first.html", SaveFormat.HTML);

Comment diviser des fichiers TXT en utilisant Python

La bibliothèque Aspose.PDF pour Python permet aux développeurs Python de diviser les fichiers TXT en parties distinctes. La fonction de division d’un document TXT en fichiers distincts vous aidera à travailler avec différentes sections d’un document volumineux en même temps et pour plusieurs utilisateurs. Le fractionnement d’un document TXT accélérera et rationalisera votre travail. Utilisez l’extrait de code suivant pour extraire les pages de votre fichier TXT.

TXT divisé - Python

Cet exemple de code montre comment fractionner un fichier TXT - Python

# save input text to pdf to file
doc = aspose.pdf.Document("1.txt", TxtLoadOptions())
doc.Save("test.pdf", SaveFormat.PDF)
index = 1

pages = pdf_editor.SplitToPages("test.pdf")
pdf_editor = aspose.pdf.PdfFileEditor()

for ms in pages:
    page = aspose.pdf.Document(ms)
    text_absorber = aspose.pdf.TextAbsorber()
    page.Pages.Accept(text_absorber)
    extracted_text = text_absorber.Text
    file = open("text_"+str(index)+".txt", "w+")
    file.write(extracted_text)
    index = index + 1

À propos de Aspose.PDF pour l'API Python

Un outil de traitement PDF permettant de créer des applications multiplateformes capables de générer, modifier, convertir, rendre, sécuriser et imprimer des documents sans utiliser Adobe Acrobat. Il prend en charge la conversion de divers formats de fichiers en PDF, y compris le HTML, et la conversion de documents PDF en différents formats de sortie. Les développeurs peuvent facilement afficher tout le contenu HTML sur une seule page PDF et convertir des fichiers HTML avec des balises graphiques SVG en fichiers PDF balisés. L’API .NET PDF propose la compression, la création de tableaux, des fonctions graphiques et d’images, des liens hypertextes, des tâches de tamponnage et de filigrane, des contrôles de sécurité étendus et une gestion personnalisée des polices.