Извлечение изображений из PDF в C#

Как извлечь изображения из PDF с помощью библиотеки .NET

Как извлечь изображения из PDF с помощью библиотеки .NET

Нужно ли извлекать изображения из PDF? Программная модификация PDF-документов — неотъемлемая часть современных цифровых рабочих процессов. С помощью библиотек.NET, таких как Aspose.PDF, разработчики могут извлекать изображения из PDF. Эти библиотеки представляют собой автономные решения, которые не зависят от другого программного обеспечения и готовы к коммерческому использованию. Они удовлетворяют все возможные потребности профессиональных разработчиков C#.

  • Извлечение текста из PDF
  • Извлечение изображений из PDF
  • Извлечение шрифтов из PDF
  • Извлечение данных из формы
  • Извлечение текста из марок
  • Извлечение данных из таблицы

Для извлечения изображений из PDF-файла мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы net. Откройте менеджер пакетов NuGet, найдите aspose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.

Package Manager Console

PM > Install-Package Aspose.PDF

Извлечение изображений из PDF в C#


Чтобы попробовать код в своей среде, вам понадобится Aspose.PDF для .NET.

  1. Загрузите PDF-файл вместе с экземпляром документа.
  2. Создайте объект Ximage для извлечения изображений.
  3. Сохраните выходное изображение в файл jpeg.
  4. Сохраните обновленный PDF-файл.

Извлечение изображений из PDF - C#

В этом примере кода показано, как извлекать изображения из PDF-документов.

Input file:

File not added

Output format:

PDF

Output file:

    // For complete examples and data files, please go to https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // The path to the documents directory.
    string dataDir = RunExamples.GetDataDir_AsposePdf_Images();

    // Open document
    Document pdfDocument = new Document(dataDir+ "ExtractImages.pdf");

    // Extract a particular image
    XImage xImage = pdfDocument.Pages[1].Resources.Images[1];

    FileStream outputImage = new FileStream(dataDir + "output.jpg", FileMode.Create);

    // Save output image
    xImage.Save(outputImage, ImageFormat.Jpeg);
    outputImage.Close();

    dataDir = dataDir + "ExtractImages_out.pdf";

    // Save updated PDF file
    pdfDocument.Save(dataDir);

О Aspose.PDF для API .NET

Aspose.PDF for C# API предоставляет широкий набор функций для работы с PDF-файлами. Некоторые из этих функций включают в себя:

  • Создавайте PDF-документы с нуля или из HTML, XML или изображений.
  • Редактируйте существующие PDF-документы, добавляя или удаляя страницы, текст, изображения и другое содержимое.
  • Конвертируйте PDF-документы в другие форматы, такие как HTML, XML и изображения.
  • Рендеринг PDF-документов в изображения или формат XPS.
  • Печатайте PDF-документы прямо из приложения.
  • Цифровая подпись PDF-документов.

Дополнительную информацию о Aspose.PDF для C# API можно найти в этой документации Aspose