Combinar PDF a TEXT mediante Python

Combine documentos PDF en formatos únicos TEXT en .NET mediante Python. Los programadores pueden usar este código de ejemplo para combinar PDF en .NET Framework, .NET Core y PHP, VBScript, Delphi y C++ mediante COM Interop.

Combinar PDF a TEXT mediante Python

¿Cómo fusionar PDF con TEXT? Con la biblioteca Aspose.PDF for Python via .NET, puede combinar PDF con TEXT mediante programación. El software PDF de Aspose es ideal para particulares, pequeñas o grandes empresas. Dado que es capaz de procesar una gran cantidad de información, realice la concatenación de forma rápida y eficiente y proteja sus datos. Una característica peculiar de Aspose.PDF es una API para fusionar PDF con TEXT. La característica de este enfoque es que solo necesita abrir el administrador de paquetes NuGet, buscar «Aspose.pdf for .NET» e instalarlo sin ninguna configuración compleja especial. (Utilice el comando de la consola de Package Manager para realizar la instalación). Consulte los detalles de la instalación de la biblioteca en las páginas Documentación. Para comprobar las ventajas de la biblioteca, intente utilizar el fragmento de código de conversión de PDF a TEXT.

Python Package Manager Console

pip install aspose-pdf

Cómo combinar PDF con TEXT mediante Python


Los desarrolladores de Python for .NET pueden cargar y combinar fácilmente archivos PDF en TEXT en solo unas pocas líneas de código.

  1. Lea dos archivos PDF
  2. Creación de un absorbedor de texto
  3. Extraer texto de archivos PDF mediante la aplicación de TextAbsorber a ambos PDF
  4. Almacenamiento de texto extraído
  5. Escribir texto extraído en un archivo

Este es un ejemplo que muestra cómo combinar PDF con TEXT en Python. Combina varios documentos en un solo archivo con facilidad. Si está desarrollando código en Python, esta tarea puede ser más sencilla de lo que parece. Puede utilizar nombres de archivo completos tanto para leer PDF como para escribir TEXT. Consulte este ejemplo de Python que muestra cómo combinar varios documentos del mismo tipo o de diferentes tipos de archivo en un solo archivo mediante Python

Combina archivos PDF con Python for .NET y guárdalos como TEXT

Ejemplo Python: este código de ejemplo muestra la concatenación de PDF a TEXT

Input file:

File not added

File not added

Output format:

TEXT

Output file:


# read PDF files to Aspose Document
first_doc = aspose.pdf.Document("1.pdf")
second_doc = aspose.pdf.Document("2.pdf")

# create text absorber for extract text
text_absorber = aspose.pdf.text.TextAbsorber()
first_doc.Accept(text_absorber)
second_doc.Accept(text_absorber)
extracted_text = text_absorber.Text
with open("Merger_pdf_text.txt", "w") as f:
    f.write(extracted_text)

biblioteca Python for .NET para combinar PDF con TEXT

Aspose.PDF para Python a través de la API de.NET es compatible con los estándares y especificaciones de PDF más establecidos. Permite a los desarrolladores insertar tablas, gráficos, imágenes, hipervínculos, fuentes personalizadas (y mucho más) en documentos PDF. Además, también es posible comprimir documentos PDF. Aspose.PDF para Python a través de.NET proporciona excelentes funciones de seguridad para desarrollar documentos PDF seguros. Algunas de las funciones clave de Aspose.PDF para Python a través de la API.NET incluyen:

  • Posibilidad de leer y exportar PDF en múltiples formatos de imagen, incluidos BMP, GIF, JPEG y PNG.
  • Establezca la información básica (por ejemplo, autor, creador) del documento PDF.
  • Funciones de conversión: convierte PDF a Word, Excel y PowerPoint. Convierte PDF a formatos de imágenes. Convierte archivos PDF a formato HTML y viceversa. Convierte PDF a EPUB, texto, XPS, etc.

Puedes encontrar más información sobre Aspose.PDF para Python a través de la API.NET en nuestra documentación sobre cómo usar la API.