Extrae imágenes de un PDF en Java

Cómo extraer imágenes de un PDF con la biblioteca Java

Cómo extraer imágenes de un PDF con la biblioteca Java

¿Necesita extraer imágenes de un PDF? La modificación programática de los documentos PDF es una parte esencial de los flujos de trabajo digitales modernos. Con bibliotecas de Java como Aspose.PDF, los desarrolladores pueden extraer imágenes de un PDF. Estas bibliotecas son soluciones independientes que no dependen de otro software y están listas para su uso comercial. Cubren todas las necesidades posibles de los desarrolladores profesionales de Java.

  • Extraer texto de un PDF
  • Extraer imágenes de un PDF
  • Extraer fuentes de un PDF
  • Extraer datos del formulario
  • Extraer texto de sellos
  • Extraer datos de la tabla

Para extraer imágenes de un archivo PDF, utilizaremos la API Aspose.PDF for Java, que es una API de manipulación de documentos potente, fácil de usar y rica en funciones para la plataforma Java. Puedes descargar la versión más reciente directamente desde Maven e instalarla en tu proyecto basado en Maven añadiendo las siguientes configuraciones a pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extrae imágenes de un PDF en Java


Necesita Aspose.PDF for Java para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Cree un objeto xImage para extraer imágenes.
  3. Guarde la imagen de salida en un archivo jpeg.
  4. Guarde el archivo PDF actualizado.

Extraer imágenes de un PDF - Java

Este código de ejemplo muestra cómo extraer imágenes de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

    public static void Extract_Images(){
       // The path to the documents directory.
       String _dataDir = "/home/admin1/pdf-examples/Samples/";
       String filePath = _dataDir + "ExtractImages.pdf";

       // Load PDF document
       com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(filePath);

       com.aspose.pdf.Page page = pdfDocument.getPages().get_Item(1);
       com.aspose.pdf.XImageCollection xImageCollection = page.getResources().getImages();
       // Extract a particular image
       com.aspose.pdf.XImage xImage = xImageCollection.get_Item(1);

       try {
           java.io.FileOutputStream outputImage = new java.io.FileOutputStream(_dataDir + "output.jpg");
           // Save output image
           xImage.save(outputImage);
           outputImage.close();
       } catch (java.io.FileNotFoundException e) {
           // TODO: handle exception
           e.printStackTrace();
       } catch (java.io.IOException e) {
           // TODO: handle exception
           e.printStackTrace();
       }
   }

Acerca de Aspose.PDF para la API Java

La API Aspose.PDF para Java es una biblioteca que permite a los desarrolladores añadir capacidades de procesamiento de PDF a sus aplicaciones. Se puede usar para crear cualquier tipo de aplicaciones de 32 y 64 bits para generar o leer, convertir y manipular archivos PDF sin el uso de Adobe Acrobat. Aspose.PDF para Java permite a los desarrolladores insertar tablas, gráficos, imágenes, hipervínculos, fuentes personalizadas (y mucho más) en documentos PDF. Además, también es posible comprimir PDF. Aspose.PDF para Java ofrece excelentes funciones de seguridad para desarrollar archivos PDF seguros.

Puedes encontrar más información sobre la API de Aspose.PDF para Java en documentación y ejemplos sobre cómo usar la API. Algunas de las funciones principales de la API Aspose.PDF para Java incluyen la compatibilidad con varios formatos de archivo, incluidos HTML, XFA, TXT, PCL, XML, XPS y formatos de archivos de imagen, la compatibilidad con varias versiones de PDF y una amplia funcionalidad de hipervínculos.