Combinar PDF a TEXT mediante C#

Combine documentos PDF en formatos únicos TEXT. Los programadores pueden usar este código de ejemplo para combinar PDF en .NET Framework, .NET Core y PHP, VBScript, Delphi y C++ mediante COM Interop.

Combinar PDF con TEXT usando C#

¿Cómo fusionar PDF con TEXT? Con la biblioteca Aspose.PDF for .NET, puede combinar fácilmente PDF con TEXT mediante programación. El software PDF de Aspose es ideal para particulares y pequeñas o grandes empresas. Dado que es capaz de procesar una gran cantidad de información, realice la concatenación de forma rápida y eficiente y proteja sus datos. Una característica peculiar de Aspose.PDF es una API para fusionar PDF con TEXT.

La característica de este enfoque es que solo necesita abrir el administrador de paquetes NuGet, buscar «Aspose.pdf for .NET» e instalarlo sin ninguna configuración compleja especial. (Utilice el comando de la consola de Package Manager para realizar la instalación). Para convertir PDF en TEXT, utilizaremos la API Aspose.PDF for .NET, que es una API de conversión rica en funciones, potente y fácil de usar para la plataforma .NET. Consulte los detalles de la instalación de la biblioteca en las páginas Documentación. Para comprobar las ventajas de la biblioteca, intente utilizar el fragmento de código de conversión de PDF a TEXT.

Package Manager Console

PM > Install-Package Aspose.PDF

Cómo combinar PDF con TEXT mediante C#


Los desarrolladores de .NET pueden cargar y combinar fácilmente archivos PDF en TEXT en solo unas pocas líneas de código.

  1. Lea dos archivos PDF
  2. Creación de un absorbedor de texto
  3. Extraer texto de archivos PDF mediante la aplicación de TextAbsorber a ambos PDF
  4. Almacenamiento de texto extraído
  5. Escribir texto extraído en un archivo

Este es un ejemplo que muestra cómo combinar PDF con TEXT en C#. Combina varios documentos en un solo archivo con facilidad. Si está desarrollando código en C#, esta tarea puede ser más sencilla de lo que parece. Puede utilizar nombres de archivo completos tanto para leer PDF como para escribir TEXT. Consulte este ejemplo de C# que muestra cómo combinar varios documentos del mismo tipo o de diferentes tipos de archivo en un solo archivo mediante C#

Combina archivos PDF con .NET y guárdalos como TEXT

Ejemplo C#: este código de ejemplo muestra la concatenación de PDF a TEXT

Input file:

File not added

File not added

Output format:

TEXT

Output file:

var inputFile1 = Path.Combine(dataDir, "1.pdf");
var inputFile2 = Path.Combine(dataDir, "2.pdf");
var outputFile = Path.Combine(dataDir, "merger_pdf_txt.txt");

using var pdfDocument1 = new Aspose.Pdf.Document(inputFile1);
using var pdfDocument2 = new Aspose.Pdf.Document(inputFile2);
pdfDocument1.Merge(pdfDocument2);

var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
textAbsorber.Visit(pdfDocument1);
string extractedText = textAbsorber.Text;
File.WriteAllText(outputFile, extractedText);

API para que C# combine PDF en TEXT

La API Aspose.PDF for C# proporciona una amplia gama de funciones para trabajar con archivos PDF. Algunas de las funciones incluyen:

  • Crea documentos PDF desde cero o desde HTML, XML o imágenes.
  • Edite documentos PDF existentes añadiendo o eliminando páginas, texto, imágenes y otro contenido.
  • Convierte documentos PDF a otros formatos, como HTML, XML e imágenes.
  • Renderice documentos PDF a imágenes o formato XPS.
  • Imprima documentos PDF directamente desde su aplicación.
  • Firme digitalmente documentos PDF.

Puede encontrar más información sobre la API Aspose.PDF for C# en esta documentación de Aspose