Extrae imágenes de un PDF en Java

Cómo extraer imágenes de un PDF con Java

Cómo extraer imágenes de un PDF con la herramienta Aspose.PDF for Java

¿Necesita extraer imágenes de un PDF? La modificación programática de los documentos PDF es una parte esencial de los flujos de trabajo digitales modernos. Con bibliotecas de Java como Aspose.PDF, los desarrolladores pueden extraer imágenes de un PDF. Estas bibliotecas son soluciones independientes que no dependen de otro software y están listas para su uso comercial. Cubren todas las necesidades posibles de los desarrolladores profesionales de Java.

Extraer texto de un PDF
Extraer imágenes de un PDF
Extraer fuentes de un PDF
Extraer datos del formulario
Extraer texto de sellos
Extraer datos de la tabla

Para extraer imágenes de un archivo PDF, utilizaremos la API Aspose.PDF for Java, que es una API de manipulación de documentos potente, fácil de usar y rica en funciones para la plataforma Java. Puedes descargar la versión más reciente directamente desde Maven e instalarla en tu proyecto basado en Maven añadiendo las siguientes configuraciones a pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extrae imágenes de un PDF en Java

Necesita Aspose.PDF for Java para probar el código en su entorno.

Cargue el PDF con una instancia de Document.
Cree un objeto xImage para extraer imágenes.
Guarde la imagen de salida en un archivo jpeg.
Guarde el archivo PDF actualizado.

Extraer imágenes de un PDF - Java

Este código de ejemplo muestra cómo extraer imágenes de documentos PDF

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

com.aspose.pdf.Document pdfDocument = new Document("sample.pdf");
he first page of the document
com.aspose.pdf.Page page = pdfDocument.getPages().get_Item(1);
com.aspose.pdf.XImage xImage = page.getResources().getImages().get_Item(1);
the image to a file
try {
    java.io.FileOutputStream outputImage = new java.io.FileOutputStream(DATA_DIR.resolve("output.jpg").toString());
    xImage.save(outputImage);
    outputImage.close();
} catch (java.io.IOException e) {
    System.out.println(e.getMessage());
}

Acerca de Aspose.PDF for la API de Java

La API Aspose.PDF for Java es una biblioteca que permite a los desarrolladores añadir capacidades de procesamiento de PDF a sus aplicaciones. Se puede usar para crear cualquier tipo de aplicaciones de 32 y 64 bits para generar o leer, convertir y manipular archivos PDF sin el uso de Adobe Acrobat. Aspose.PDF for Java permite a los desarrolladores insertar tablas, gráficos, imágenes, hipervínculos, fuentes personalizadas (y más) en documentos PDF. Además, también es posible comprimir archivos PDF. Aspose.PDF for Java proporciona excelentes funciones de seguridad para desarrollar archivos PDF seguros.

Puede encontrar más información sobre la API de Aspose.PDF for Java en documentación y en ejemplos sobre cómo usar la API. Algunas de las funciones fundamentales de la API Aspose.PDF for Java incluyen la compatibilidad con varios formatos de archivo, incluidos los formatos HTML, XFA, TXT, PCL, XML, XPS y de archivos de imagen, la compatibilidad con diferentes versiones de PDF y una amplia funcionalidad de hipervínculos.