以 Java 从 PDF 中提取图像

如何使用 Java 库从 PDF 中提取图片

如何使用 Java 库从 PDF 中提取图片

你需要从 PDF 中提取图像吗?以编程方式修改 PDF 文档是现代数字工作流程的重要组成部分。使用像 Aspose.PDF 这样的 Java 库,开发者可以从 PDF 中提取图像。这些库是独立的解决方案,不依赖其他软件,可以用于商业用途。它们涵盖了专业 Java 开发人员的所有可能需求。

  • 从 PDF 中提取文本
  • 从 PDF 中提取图片
  • 从 PDF 中提取字体
  • 从表单中提取数据
  • 从邮票中提取文本
  • 从表中提取数据

为了从 PDF 文件中提取图像,我们将使用 Aspose.PDF for Java API,这是一款适用于 Java 平台的功能丰富、功能强大且易于使用的文档处理 API。你可以直接从 Maven 下载其最新版本,然后在pom.xml 中添加以下配置,将其安装在基于 Maven 的项目中。

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

以 Java 从 PDF 中提取图像


你需要 Aspose.PDF for Java 才能在你的环境中试用代码。

1.在 PDF 中加载 “文档” 实例。 1.创建 XImage 对象来提取图像。 1.将输出图像保存到 jpeg 文件中。 1.保存更新后的 PDF 文件。

从 PDF 中提取图像-Java

此示例代码显示如何从 PDF 文档中提取图像

Input file:

File not added

Output format:

PDF

Output file:

    public static void Extract_Images(){
       // The path to the documents directory.
       String _dataDir = "/home/admin1/pdf-examples/Samples/";
       String filePath = _dataDir + "ExtractImages.pdf";

       // Load PDF document
       com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(filePath);

       com.aspose.pdf.Page page = pdfDocument.getPages().get_Item(1);
       com.aspose.pdf.XImageCollection xImageCollection = page.getResources().getImages();
       // Extract a particular image
       com.aspose.pdf.XImage xImage = xImageCollection.get_Item(1);

       try {
           java.io.FileOutputStream outputImage = new java.io.FileOutputStream(_dataDir + "output.jpg");
           // Save output image
           xImage.save(outputImage);
           outputImage.close();
       } catch (java.io.FileNotFoundException e) {
           // TODO: handle exception
           e.printStackTrace();
       } catch (java.io.IOException e) {
           // TODO: handle exception
           e.printStackTrace();
       }
   }

关于 Aspose.PDF for Java API

Aspose.PDF for Java API 是一个允许开发人员向其应用程序添加 PDF 处理功能的库。它可用于构建任何类型的 32 位和 64 位应用程序,无需使用 Adobe Acrobat 即可生成或读取、转换和操作 PDF 文件。Aspose.PDF for Java 允许开发人员在 PDF 文档中插入表格、图形、图像、超链接、自定义字体等。此外,也可以压缩 PDF。适用于 Java 的 Aspose.PDF 为开发安全的 PDF 文件提供了出色的安全功能。

你可以在 文档 和关于如何使用 API 的 示例 上找到有关 Aspose.PDF for Java API 的更多信息。Aspose.PDF for Java API 的一些主要功能包括支持各种文件格式,包括 HTML、XFA、TXT、PCL、XML、XPS 和图像文件格式,支持各种 PDF 版本,以及广泛的超链接功能。