Extraer metadatos de PDF a través de PHP

Extraiga los metadatos del documento PDF. Utilice Aspose.PDF para que PHP via Java modifique los archivos PDF mediante programación

Cómo extraer metadatos de PDF mediante la biblioteca de PHP via Java

Extraiga los metadatos de un PDF con Aspose.PDF para.NET. Acceder a los metadatos de un documento significa obtener información sobre ese archivo, como su título, autor, fecha de creación y palabras clave específicas. Extrae metadatos: ayuda a organizar una gran colección de PDF de forma más eficaz. Los datos extraídos de los metadatos mejoran la forma de buscar archivos. Los usuarios pueden localizar rápidamente documentos específicos mediante palabras clave o detalles que se encuentran en los metadatos extraídos. La extracción de metadatos proporciona información valiosa sobre lo que contiene un archivo. Puede ofrecer un breve resumen de los detalles clave del archivo, lo que facilita la comprensión de qué trata el documento sin tener que abrirlo. La extracción de metadatos ayuda a garantizar la autenticidad de un documento. Puedes comprobar detalles como el nombre del autor cuando se creó o su historial de modificaciones. Esta verificación es crucial para confirmar la fiabilidad de un PDF. Al ofrecer detalles concisos sobre el contenido de un PDF, los metadatos extraídos mejoran mucho la experiencia del usuario. Ayuda a los usuarios a identificar fácilmente los documentos y a trabajar con ellos. En general, la extracción de metadatos de un PDF ofrece muchas ventajas, como una gestión de documentos más eficiente, mejores opciones de búsqueda, el cumplimiento de los estándares y una experiencia de usuario mejorada en general. Extraiga los metadatos de un PDF a través de Aspose y resuelva todas las tareas necesarias para trabajar con datos. Para extraer los metadatos de los archivos PDF, utilizaremos Aspose.PDF para PHP mediante la API de Java, que es una herramienta de manipulación de documentos rica en funciones, potente y fácil de usar que se encuentra en php-java. Instala la versión 9.0 de Tomcat en cualquier ubicación, añade Aspose.pdf.war y, para obtener más información, consulta la página GitHub.

Extraer metadatos de PDF a través de PHP


Necesita Aspose.PDF para PHP a través de Java para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Obtenga DocumentInfo mediante la propiedad Document.Info.
  3. Acceda y muestre diferentes propiedades de Document.Info.

El fragmento de código PHP proporcionado muestra cómo extraer metadatos de un PDF mediante la biblioteca Aspose.PDF. Abre un archivo PDF llamado ‘GetFileInfo.pdf’ ubicado en el directorio especificado por la variable ‘DIR_INPUT_METADATA’. El código recupera varios detalles del documento mediante la función «información». Muestra información de metadatos específica del PDF, como el nombre del autor, la fecha de creación, las palabras clave, la fecha de modificación, el asunto y el título. El código usa la función «imprimir» para mostrar esta información. Este fragmento de código es un ejemplo simplificado de cómo se puede usar una biblioteca o marco de Aspose.PDF para extraer metadatos de un archivo PDF.

Extraer metadatos de PDF: PHP

Este código de ejemplo muestra cómo extraer la información de metadatos del archivo PDF

Input file:

File not added

Output format:

Output file:


    // Open document
    $document = new Document($inputFile);
    
    // Get document information
    $docInfo = $document->getInfo();

    // Show document information
    $responseData1 = "Author: " . $docInfo->getAuthor() . ", ";
    $responseData2 = "Creation Date: " . $docInfo->getCreationDate() . ", ";
    $responseData3 = "Keywords: " . $docInfo->getKeywords() . ", ";
    $responseData4 = "Modify Date: " . $docInfo->getModDate() . ", ";
    $responseData5 = "Subject: " . $docInfo->getSubject() . ", ";
    $responseData6 = "Title: " . $docInfo->getTitle() . "";

    $document->close();