Extraer metadatos de PDF a través de Java

Extraiga los metadatos del documento PDF. Utilice Aspose.PDF para que Java modifique los archivos PDF mediante programación

Cómo extraer metadatos de PDF mediante la biblioteca de Java

Extraiga los metadatos de un PDF con Aspose.PDF para Java. Acceder a los metadatos de un documento significa obtener información sobre ese archivo, como su título, autor, cuándo se creó y palabras clave específicas. Extrae metadatos: ayuda a organizar una gran colección de PDF de forma más eficaz. Los datos extraídos de los metadatos mejoran la forma de buscar archivos. Los usuarios pueden localizar rápidamente documentos específicos mediante palabras clave o detalles que se encuentran en los metadatos extraídos. La extracción de metadatos proporciona información valiosa sobre lo que contiene un archivo. Puede ofrecer un breve resumen de los detalles clave del archivo, lo que facilita la comprensión de qué trata el documento sin tener que abrirlo. La extracción de metadatos ayuda a garantizar la autenticidad de un documento. Puedes comprobar detalles como el nombre del autor cuando se creó o su historial de modificaciones. Esta verificación es crucial para confirmar la fiabilidad de un PDF. Al ofrecer detalles concisos sobre el contenido de un PDF, los metadatos extraídos mejoran mucho la experiencia del usuario. Ayuda a los usuarios a identificar fácilmente los documentos y a trabajar con ellos. En general, la extracción de metadatos de un PDF ofrece muchas ventajas, como una gestión de documentos más eficiente, mejores opciones de búsqueda, el cumplimiento de los estándares y una experiencia de usuario mejorada en general. Extraiga los metadatos de un PDF a través de Aspose y resuelva todas las tareas necesarias para trabajar con datos. Para extraer los metadatos de los archivos PDF, utilizaremos la API Aspose.PDF para Java, que es una API de conversión rica en funciones, potente y fácil de usar para la plataforma Java. Puedes descargar su versión más reciente directamente desde Maven e instalarla en tu proyecto basado en Maven añadiendo las siguientes configuraciones al pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraer metadatos de PDF a través de Java


Necesita Aspose.PDF for Java para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Obtenga DocumentInfo mediante la propiedad Document.Info.
  3. Acceda y muestre diferentes propiedades de Document.Info.

El fragmento de código Java proporcionado muestra cómo extraer metadatos de un PDF mediante la biblioteca Aspose.PDF. Abre un archivo PDF llamado ‘GetFileInfo.pdf’ ubicado en el directorio especificado por la variable ‘DIR_INPUT_METADATA’. El código recupera varios detalles del documento mediante la función «información». Muestra información de metadatos específica del PDF, como el nombre del autor, la fecha de creación, las palabras clave, la fecha de modificación, el asunto y el título. El código usa la función «imprimir» para mostrar esta información. Este fragmento de código es un ejemplo simplificado de cómo se puede usar una biblioteca o marco de Aspose.PDF para extraer metadatos de un archivo PDF.

Extraer metadatos de PDF: Java

Este código de ejemplo muestra cómo extraer la información de metadatos del archivo PDF

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());