Конвертер формата PDF с помощью Java
Экспорт PDF в Microsoft Office® Word, Excel, PowerPoint, презентации, изображения, HTML и форматы с фиксированной разметкой
Обзор
В редких случаях возникает необходимость манипулировать документами, отличными от PDF, при наличии данных синтаксического анализа в форматах PDF. Таким образом, для таких приложений будет два сценария: либо они добавляют функциональность синтаксического анализа PDF в свое собственное решение, либо добавляют функцию преобразования PDF для манипулирования данными в поддерживаемых форматах. Для второго сценария преобразования PDF в Word**, Excel, HTML, изображения или любой требуемый формат реализовать код программы чтения и конвертераC# PDF-файла в базе.NET очень просто. Здесь мы обсуждаем несколько случаев, чтобы программисты могли изменять эти фрагменты кода преобразования в соответствии со своими требованиями.
Преобразование PDF-файлов в формат Microsoft Word 2003-2019
Библиотека Aspose.PDF для .NET поддерживает все преобразования PDF в Word. Если мы просто конвертируем документы Microsoft Word без каких-либо специальных настроек, мы просто загружаем PDF-файл методом Save из класса Document и будем использовать путь к выходному документу Word и SaveFormat в качестве параметров. Для особых случаев, когда необходимо увеличить расстояние между линиями, разрешение изображения и другие настройки, в API есть класс DocSaveOptions, который предоставляет все эти настройки.
Сохранение PDF в виде файлов Excel
Специализированное SaveFormat.excel Доступно перечисление для сохранения PDF в определенные выходные форматы Microsoft Excel XLS XLSX. Кроме того, .NET PDF-библиотека также имеет специальный класс ExcelSaveOptions, который не только занимается сохранением в форматах Excel, но также предоставляет различные функции и свойства для установки различных атрибутов, таких как точный выходной формат, минимизация количество рабочих листов и многое другое.
Преобразование PDF в презентации PowerPoint
.NET PDF API поддерживает преобразование страниц PDF в слайды презентации PowerPoint с выбираемым текстом или изображениями путем рендеринга слайдов как изображений. Шаблон сохранения Portable Document Format в PowerPoint почти такой же: загрузка файла с использованием класса Document, а затем вызов метода Save с путем к выходному файлу и SaveFormat в качестве параметров. В случае рендеринга со специальными параметрами представления программисты могут использовать класс PptxSaveOptions с любыми соответствующими конкретными параметрами рендеринга. Вызов метода сохранения и передача параметров в качестве параметра.
Конвертация формата переносимого документа PDF в HTML
Библиотека разбора PDF поддерживает сохранение PDF в HTML как целиком, так и со встроенными ресурсами, включая изображения. Процедура преобразования аналогична процедуре преобразования PDF в другие форматы для общих случаев, таких как загрузка исходного документа и вызов метода Save с выходным путем к файлу HTML и SaveFormat.Html в качестве параметров. В случае сохранения со встроенными ресурсами существует класс HTMLSaveOptions с несколькими опциями, такими как сохранение изображений в определенную папку во время преобразования, разделение полученного HTML на несколько страниц и многое другое.
Преобразование PDF в изображения
Преобразование страниц PDF в изображения, включая PNG, JPEG, TIFF, BMP и т. д., легко в приложениях на базе файла.NET с помощью приведенных ниже фрагментов кода. Разработчики могут просматривать страницы PDF после загрузки файла и преобразовывать страницу за страницей в требуемый формат изображения. Разработчики могут устанавливать горизонтальное и вертикальное разрешение изображений с помощью Класс разрешения