Извлечение изображений из PDF в Java

Как извлечь изображения из PDF с помощью библиотеки Java

Как извлечь изображения из PDF с помощью библиотеки Java

Нужно ли извлекать изображения из PDF? Программная модификация PDF-документов — неотъемлемая часть современных цифровых рабочих процессов. С помощью библиотек Java, таких как Aspose.PDF, разработчики могут извлекать изображения из PDF. Эти библиотеки представляют собой автономные решения, которые не полагаются на другое программное обеспечение и готовы к коммерческому использованию. Они удовлетворяют все возможные потребности профессиональных разработчиков Java.

  • Извлечение текста из PDF
  • Извлечение изображений из PDF
  • Извлечение шрифтов из PDF
  • Извлечение данных из формы
  • Извлечение текста из марок
  • Извлечение данных из таблицы

Для извлечения изображений из PDF-файла мы будем использовать API Aspose.PDF for Java, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы Java. Вы можете загрузить последнюю версию программы непосредственно из Maven и установить ее в своем проекте на базе Maven, добавив в pom.xml следующие конфигурации.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Извлечение изображений из PDF в Java


Чтобы попробовать код в своей среде, вам понадобится Aspose.PDF для Java.

  1. Загрузите PDF-файл вместе с экземпляром документа.
  2. Создайте объект Ximage для извлечения изображений.
  3. Сохраните выходное изображение в файл jpeg.
  4. Сохраните обновленный PDF-файл.

Извлечение изображений из PDF - Java

В этом примере кода показано, как извлекать изображения из PDF-документов.

Input file:

File not added

Output format:

PDF

Output file:

    public static void Extract_Images(){
       // The path to the documents directory.
       String _dataDir = "/home/admin1/pdf-examples/Samples/";
       String filePath = _dataDir + "ExtractImages.pdf";

       // Load PDF document
       com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(filePath);

       com.aspose.pdf.Page page = pdfDocument.getPages().get_Item(1);
       com.aspose.pdf.XImageCollection xImageCollection = page.getResources().getImages();
       // Extract a particular image
       com.aspose.pdf.XImage xImage = xImageCollection.get_Item(1);

       try {
           java.io.FileOutputStream outputImage = new java.io.FileOutputStream(_dataDir + "output.jpg");
           // Save output image
           xImage.save(outputImage);
           outputImage.close();
       } catch (java.io.FileNotFoundException e) {
           // TODO: handle exception
           e.printStackTrace();
       } catch (java.io.IOException e) {
           // TODO: handle exception
           e.printStackTrace();
       }
   }

О Aspose.PDF для API Java

Aspose.PDF for Java API — это библиотека, которая позволяет разработчикам добавлять в свои приложения возможности обработки PDF. Ее можно использовать для создания любых 32-битных и 64-разрядных приложений для создания, чтения, преобразования и обработки PDF-файлов без использования Adobe Acrobat. Aspose.PDF для Java позволяет разработчикам вставлять таблицы, графики, изображения, гиперссылки, собственные шрифты и многое другое в PDF-документы. Кроме того, можно сжимать PDF. Aspose.PDF для Java предоставляет отличные функции безопасности для разработки защищенных PDF-файлов.

Дополнительную информацию о Aspose.PDF для Java API можно найти в документации и примеры об использовании API. Некоторые из ключевых функций Aspose.PDF for Java API включают поддержку различных форматов файлов, включая HTML, XFA, TXT, PCL, XML, XPS и форматы файлов изображений, поддержку различных версий PDF и расширенные функции гиперссылок.