Extrae imágenes de un PDF en C#

Cómo extraer imágenes de un PDF con la biblioteca .NET

Cómo extraer imágenes de un PDF con la biblioteca .NET

¿Necesita extraer imágenes de un PDF? La modificación programática de los documentos PDF es una parte esencial de los flujos de trabajo digitales modernos. Con librerías de.NET como Aspose.PDF, los desarrolladores pueden extraer imágenes de un PDF. Estas bibliotecas son soluciones independientes que no dependen de otro software y están listas para su uso comercial. Cubren todas las necesidades posibles de los desarrolladores profesionales de C#.

  • Extraer texto de un PDF
  • Extraer imágenes de un PDF
  • Extraer fuentes de un PDF
  • Extraer datos del formulario
  • Extraer texto de sellos
  • Extraer datos de la tabla

Para extraer imágenes de un archivo PDF, utilizaremos la API Aspose.PDF para.NET, que es una API de manipulación de documentos potente, fácil de usar y rica en funciones para la plataforma net. Abre el administrador de paquetes NuGet, busca Aspose.pdf e instálalo. También puede usar el siguiente comando desde la consola del administrador de paquetes.

Package Manager Console

PM > Install-Package Aspose.PDF

Extrae imágenes de un PDF en C#


Para probar el código en su entorno, necesita Aspose.PDF for .NET.

  1. Cargue el PDF con una instancia de Document.
  2. Cree un objeto xImage para extraer imágenes.
  3. Guarde la imagen de salida en un archivo jpeg.
  4. Guarde el archivo PDF actualizado.

Extraer imágenes de un PDF - C#

Este código de ejemplo muestra cómo extraer imágenes de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

    // For complete examples and data files, please go to https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // The path to the documents directory.
    string dataDir = RunExamples.GetDataDir_AsposePdf_Images();

    // Open document
    Document pdfDocument = new Document(dataDir+ "ExtractImages.pdf");

    // Extract a particular image
    XImage xImage = pdfDocument.Pages[1].Resources.Images[1];

    FileStream outputImage = new FileStream(dataDir + "output.jpg", FileMode.Create);

    // Save output image
    xImage.Save(outputImage, ImageFormat.Jpeg);
    outputImage.Close();

    dataDir = dataDir + "ExtractImages_out.pdf";

    // Save updated PDF file
    pdfDocument.Save(dataDir);

Acerca de Aspose.PDF para la API .NET

La API Aspose.PDF para C# proporciona una amplia gama de funciones para trabajar con archivos PDF. Algunas de las funciones incluyen:

  • Cree documentos PDF desde cero o a partir de HTML, XML o imágenes.
  • Edite documentos PDF existentes añadiendo o eliminando páginas, texto, imágenes y otro contenido.
  • Convierte documentos PDF a otros formatos como HTML, XML e imágenes.
  • Renderice documentos PDF a imágenes o formato XPS.
  • Imprima documentos PDF directamente desde su aplicación.
  • Firme digitalmente documentos PDF.

Puedes encontrar más información sobre Aspose.PDF para la API de C# en esta documentación de Aspose