Extraia imagens do PDF em Java

Como extrair imagens de um PDF usando a biblioteca Java

Como extrair imagens de um PDF usando a biblioteca Java

Você precisa extrair imagens do PDF? A modificação programática de documentos PDF é uma parte essencial dos fluxos de trabalho digitais modernos. Com bibliotecas Java como a Aspose.PDF, os desenvolvedores podem extrair imagens do PDF. Essas bibliotecas são soluções autônomas que não dependem de outros softwares e estão prontas para uso comercial. Eles cobrem todas as necessidades possíveis dos desenvolvedores profissionais de Java.

  • Extraia texto do PDF
  • Extraia imagens de PDF
  • Extrair fontes do PDF
  • Extrair dados do formulário
  • Extrair texto de carimbos
  • Extrair dados da tabela

Para extrair imagens do arquivo PDF, usaremos a API Aspose.PDF for Java, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma Java. Você pode baixar sua versão mais recente diretamente do Maven e instalá-la em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraia imagens do PDF em Java


Você precisa do Aspose.PDF para Java para testar o código em seu ambiente.

  1. Carregue o PDF com uma instância do Document.
  2. Crie um objeto XImage para extrair imagens.
  3. Salve a imagem de saída em arquivo jpeg.
  4. Salve o arquivo PDF atualizado.

Extraia imagens do PDF - Java

Este código de exemplo mostra como extrair imagens de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

    public static void Extract_Images(){
       // The path to the documents directory.
       String _dataDir = "/home/admin1/pdf-examples/Samples/";
       String filePath = _dataDir + "ExtractImages.pdf";

       // Load PDF document
       com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(filePath);

       com.aspose.pdf.Page page = pdfDocument.getPages().get_Item(1);
       com.aspose.pdf.XImageCollection xImageCollection = page.getResources().getImages();
       // Extract a particular image
       com.aspose.pdf.XImage xImage = xImageCollection.get_Item(1);

       try {
           java.io.FileOutputStream outputImage = new java.io.FileOutputStream(_dataDir + "output.jpg");
           // Save output image
           xImage.save(outputImage);
           outputImage.close();
       } catch (java.io.FileNotFoundException e) {
           // TODO: handle exception
           e.printStackTrace();
       } catch (java.io.IOException e) {
           // TODO: handle exception
           e.printStackTrace();
       }
   }

Sobre o Aspose.PDF para a API Java

A API Aspose.PDF for Java é uma biblioteca que permite aos desenvolvedores adicionar recursos de processamento de PDF aos seus aplicativos. Ele pode ser usado para criar qualquer tipo de aplicativo de 32 bits e 64 bits para gerar ou ler, converter e manipular arquivos PDF sem o uso do Adobe Acrobat. O Aspose.PDF para Java permite que os desenvolvedores insiram tabelas, gráficos, imagens, hiperlinks, fontes personalizadas e muito mais em documentos PDF. Além disso, também é possível compactar PDF. O Aspose.PDF para Java fornece excelentes recursos de segurança para desenvolver arquivos PDF seguros.

Você pode encontrar mais informações sobre a API Aspose.PDF para Java em documentação e exemplos sobre como usar a API. Alguns dos principais recursos da API Aspose.PDF para Java incluem suporte para vários formatos de arquivo, incluindo HTML, XFA, TXT, PCL, XML, XPS e formatos de arquivo de imagem, suporte para várias versões de PDF e ampla funcionalidade de hiperlink.