Extraia imagens do PDF em C#

Como extrair imagens de um PDF usando a biblioteca .NET

Como extrair imagens de um PDF usando a biblioteca .NET

Você precisa extrair imagens do PDF? A modificação programática de documentos PDF é uma parte essencial dos fluxos de trabalho digitais modernos. Com bibliotecas.NET como a Aspose.PDF, os desenvolvedores podem extrair imagens do PDF. Essas bibliotecas são soluções autônomas que não dependem de outros softwares e estão prontas para uso comercial. Eles cobrem todas as necessidades possíveis dos desenvolvedores profissionais de C#.

  • Extraia texto do PDF
  • Extraia imagens de PDF
  • Extrair fontes do PDF
  • Extrair dados do formulário
  • Extrair texto de carimbos
  • Extrair dados da tabela

Para extrair imagens do arquivo PDF, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma net. Abra o gerenciador de pacotes NuGet, pesquise Aspose.pdf e instale. Você também pode usar o seguinte comando no console do Gerenciador de Pacotes.

Package Manager Console

PM > Install-Package Aspose.PDF

Extraia imagens do PDF em C#


Para testar o código em seu ambiente, você precisa de Aspose.PDF for .NET.

  1. Carregue o PDF com uma instância do Document.
  2. Crie um objeto XImage para extrair imagens.
  3. Salve a imagem de saída em arquivo jpeg.
  4. Salve o arquivo PDF atualizado.

Extraia imagens do PDF - C#

Este código de exemplo mostra como extrair imagens de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

    // For complete examples and data files, please go to https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // The path to the documents directory.
    string dataDir = RunExamples.GetDataDir_AsposePdf_Images();

    // Open document
    Document pdfDocument = new Document(dataDir+ "ExtractImages.pdf");

    // Extract a particular image
    XImage xImage = pdfDocument.Pages[1].Resources.Images[1];

    FileStream outputImage = new FileStream(dataDir + "output.jpg", FileMode.Create);

    // Save output image
    xImage.Save(outputImage, ImageFormat.Jpeg);
    outputImage.Close();

    dataDir = dataDir + "ExtractImages_out.pdf";

    // Save updated PDF file
    pdfDocument.Save(dataDir);

Sobre o Aspose.PDF para a API .NET

A API Aspose.PDF for C# fornece uma ampla variedade de recursos para trabalhar com arquivos PDF. Alguns dos recursos incluem:

  • Crie documentos PDF do zero ou de HTML, XML ou imagens.
  • Edite documentos PDF existentes adicionando ou removendo páginas, texto, imagens e outros conteúdos.
  • Converta documentos PDF em outros formatos, como HTML, XML e imagens.
  • Renderize documentos PDF em imagens ou formato XPS.
  • Imprima documentos PDF diretamente do seu aplicativo.
  • Assine digitalmente documentos PDF.

Você pode encontrar mais informações sobre a API Aspose.PDF para C# nesta documentação do Aspose