Извлеките PDF-файл с помощью C#

Как извлечь текст и изображения из PDF с помощью библиотеки .NET

C# Java C++ Python

Самый популярный экшен с Parser

Извлечь текст

Извлечь изображения

Извлечь шрифты

Как анализировать PDF-файлы с помощью библиотеки .NET

Вам нужно извлечь PDF-файл? Программная модификация PDF-документов является неотъемлемой частью современных цифровых рабочих процессов. С помощью библиотек.NET, таких как Aspose.PDF, разработчики могут извлекать текст из PDF или извлекать изображения из PDF. Эти библиотеки представляют собой автономные решения, которые не зависят от другого программного обеспечения и готовы к коммерческому использованию. Они охватывают все возможные потребности профессиональных разработчиков на C#.

Извлекайте данные PDF: тексты, изображения, формы, поля и т. д.
Извлечение текста из PDF
Извлечение изображений из PDF
Извлечение шрифтов из PDF
Извлечение данных из формы
Извлечение текста из штампов
Извлечение данных из таблицы

Для извлечения PDF-файла мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы net. Откройте диспетчер пакетов NuGet, найдите aSpose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.

Package Manager Console

PM > Install-Package Aspose.PDF

Анализ PDF с помощью C#

Чтобы попробовать код в своей среде, вам нужно Aspose.PDF for .NET.

Загрузите PDF-файл вместе с экземпляром документа.
Создайте объект TextAbsorber для извлечения текста.
Примите абсорбер для всех страниц.
Получите извлеченный текст
Создайте устройство записи и откройте файл, запишите в файл строку текста

Извлечение PDF-файлов - C#

В этом примере кода показано, как извлекать PDF-документы

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

var inputFile = Path.Combine(dataDir, "ExtractTextAll.pdf");
var outputFile = Path.Combine(dataDir, "ExtractedText.txt");
var pdfDocument = new Aspose.Pdf.Document(inputFile);
var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
pdfDocument.Pages.Accept(textAbsorber);
File.WriteAllText(outputFile, textAbsorber.Text);

Самый популярный экшен с Parser

Как анализировать PDF-файлы с помощью библиотеки .NET

Анализ PDF с помощью C#

Извлечение PDF-файлов - C#

О файле Aspose.PDF для API .NET