Dividir archivos mediante Python for .NET

División de archivos con la ayuda de la biblioteca Python for .NET del lado del servidor.

Dividir archivos mediante la biblioteca Python for .NET

¿Necesitas solo una parte de tus archivos de gran tamaño? Para separar una o más partes del documento, debe dividir las páginas del archivo original. Para dividir archivos, utilizaremos la API Aspose.PDF for Python, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Abra el administrador de paquetes NuGet, busque Aspose.pdf e instálelo. También puede utilizar el siguiente comando desde la consola del administrador de paquetes. Nuestra herramienta de software también permite a los desarrolladores dividir documentos de Word, PDF, HTML, TXT y DOCX en partes. Para obtener más información, consulte Páginas de documentación.

Python Package Manager Console

pip install aspose-pdf

Dividir documentos mediante Python


Necesita Aspose.PDF for .NET para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Cree un nuevo objeto de clase Document para dividir páginas PDF.
  3. Agregue la página actual al documento.
  4. Guardar la página actual como un PDF independiente

Cómo dividir archivos PDF con Python

Con la biblioteca Aspose.PDF para Python, puede dividir documentos PDF de gran tamaño. Dividir un documento PDF es un caso de uso común cuando se trabaja con documentos PDF. Ayuda a reducir el tamaño de un archivo PDF al dividir documentos grandes en archivos más pequeños para enviarlos por correo electrónico.

PDF dividido - Python

<% splitter.code-block1.subtitle %>

 doc = aspose.pdf.Document("1.pdf")

 pdf_editor = aspose.pdf.PdfFileEditor()
 pdf_editor.Extract(path_source, 1, doc.Pages.Count / 2, "pdf_half.pdf")

Cómo dividir archivos HTML con Python

Los documentos HTML pueden ser grandes, ya que pueden contener texto, imágenes, gráficos y mucho más. Es posible que tenga que separar los archivos HTML según los diferentes requisitos o casos de uso. La biblioteca Aspose.PDF para Python le ayudará con esta tarea.

HTML dividido: Python

<% splitter.code-block2.subtitle %>

 doc = aspose.pdf.Document("test.pdf");

 # save input html to pdf to file
 doc = aspose.pdf.Document("1.html", HtmlLoadOptions);
 doc.Save("test.pdf", SaveFormat.PDF);

 # slit first page
 pdf_editor = aspose.pdf.PdfFileEditor();
 pdf_editor.SplitFromFirst("test.pdf", 1, "test.pdf");
 doc.Save("html_first.html", SaveFormat.HTML);

Cómo dividir archivos TXT con Python

La biblioteca Aspose.PDF para Python permite a los desarrolladores de Python dividir los archivos TXT en partes separadas. La función de dividir un documento TXT en archivos separados le ayudará a trabajar con diferentes secciones de un documento grande al mismo tiempo y para varios usuarios. Dividir un documento TXT acelerará y agilizará tu trabajo. Usa el siguiente fragmento de código para extraer las páginas de tu archivo TXT.

TXT dividido: Python

<% splitter.code-block3.subtitle %>

# save input text to pdf to file
doc = aspose.pdf.Document("1.txt", TxtLoadOptions())
doc.Save("test.pdf", SaveFormat.PDF)
index = 1

pages = pdf_editor.SplitToPages("test.pdf")
pdf_editor = aspose.pdf.PdfFileEditor()

for ms in pages:
    page = aspose.pdf.Document(ms)
    text_absorber = aspose.pdf.TextAbsorber()
    page.Pages.Accept(text_absorber)
    extracted_text = text_absorber.Text
    file = open("text_"+str(index)+".txt", "w+")
    file.write(extracted_text)
    index = index + 1

Acerca de Aspose.PDF para la API Python

Una biblioteca de procesamiento de PDF para crear aplicaciones multiplataforma con la capacidad de generar, modificar, convertir, renderizar, proteger e imprimir documentos sin utilizar Adobe Acrobat. Admite la conversión de varios formatos de archivo a PDF, incluido HTML, y la conversión de documentos PDF a varios formatos de salida. Los desarrolladores pueden representar fácilmente todo el contenido HTML en un PDF de una sola página, así como convertir archivos HTML con etiquetas gráficas SVG en archivos PDF con etiquetas. La API PDF .NET ofrece funciones de compresión, creación de tablas, gráficos e imágenes, hipervínculos, tareas de estampación y marcas de agua, controles de seguridad ampliados y manejo de fuentes personalizado.