Extraia metadados de PDF via Java

Extraia metadados do documento PDF. Use o Aspose.PDF for Java para modificar arquivos PDF programaticamente

Como extrair metadados de PDF usando a biblioteca Java

Extraia metadados do PDF usando o Aspose.PDF for Java. Acessar os metadados de um documento significa obter informações sobre esse arquivo, como título, autor, quando ele foi criado e palavras-chave específicas. Extraia metadados, ajuda a organizar uma grande coleção de PDF com mais eficiência. Os dados extraídos dos metadados melhoram a forma como você pode pesquisar arquivos. Os usuários podem localizar rapidamente documentos específicos usando palavras-chave ou detalhes encontrados nos metadados extraídos. A extração de metadados fornece informações valiosas sobre o que um arquivo contém. Ele pode oferecer um breve resumo dos principais detalhes sobre o arquivo, facilitando a compreensão do que é o documento sem precisar abri-lo. Extrair metadados ajuda a garantir que um documento seja autêntico. Você pode verificar detalhes como o nome do autor quando ele foi criado ou seu histórico de modificações. Essa verificação é crucial para confirmar a confiabilidade de um PDF. Ao oferecer detalhes concisos sobre o conteúdo de um PDF, os metadados extraídos tornam a experiência do usuário muito melhor. Ele ajuda os usuários a identificar e trabalhar facilmente com documentos. No geral, a extração de metadados em PDF oferece muitas vantagens, como gerenciamento de documentos mais eficiente, opções de pesquisa aprimoradas, conformidade com padrões e uma experiência geral aprimorada do usuário. Extraia metadados do PDF via Aspose e resolva todas as tarefas necessárias no trabalho com dados. Para extrair metadados de arquivos PDF, usaremos a API Aspose.PDF for Java, que é uma API de conversão rica em recursos, poderosa e fácil de usar para a plataforma Java. Você pode baixar a versão mais recente diretamente do Maven e instalá-la em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraia metadados de PDF via Java

Você precisa do Aspose.PDF for Java para testar o código em seu ambiente.

Carregue o PDF com uma instância de Document.
Obtenha DocumentInfo usando a propriedade Document.Info.
Acesse e exiba propriedades diferentes do Document.Info.

O trecho de código Java fornecido mostra como extrair metadados do PDF pela biblioteca Aspose.PDF. Ele abre um arquivo PDF chamado ‘GetFileInfo.pdf’ localizado no diretório especificado pela variável ‘DIR_INPUT_METADATA’. O código recupera vários detalhes do documento usando a função ‘info’. Ele exibe informações específicas de metadados do PDF, como nome do autor, data de criação, palavras-chave, data de modificação, assunto e título. O código usa a função ‘imprimir’ para mostrar essas informações. Esse trecho de código é um exemplo simplificado de como você pode usar uma biblioteca ou estrutura Aspose.PDF for extrair metadados de um arquivo PDF.

Extraia metadados de PDF - Java

Este exemplo de código mostra como extrair informações de metadados do arquivo PDF

Input file:

Upload a file

File not added

Output format:

Output file:

Document pdfDocument = new Document(DATA_DIR.resolve("sample.pdf").toString());
// Get document information
DocumentInfo docInfo = pdfDocument.getInfo();
// Show document information
System.out.println("Author: " + docInfo.getAuthor());
System.out.println("Creation Date: " + docInfo.getCreationDate());
System.out.println("Keywords: " + docInfo.getKeywords());
System.out.println("Modify Date: " + docInfo.getModDate());
System.out.println("Subject: " + docInfo.getSubject());
System.out.println("Title: " + docInfo.getTitle());
pdfDocument.close();