Анализ форматов PPT в Java
Нативный и высокопроизводительный анализ документов PPT с использованием серверных API-интерфейсов Aspose.Slides for Java без использования какого-либо программного обеспечения, такого как Microsoft или Adobe PDF.
Как разобрать файл PPT с помощью Java
Чтобы разобрать файл PPT, мы будем использовать
API, который представляет собой многофункциональный, мощный и простой в использовании API синтаксического анализа для платформы Java. Вы можете скачать его последнюю версию прямо с
и установите его в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml.
Репозиторий
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
Зависимость
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-slides</artifactId>
<version>version of aspose-slides API</version>
<classifier>jdk17</classifier>
</dependency>
Шаги для разбора файлов PPT в Java
Базовый синтаксический анализ документа с помощью API Aspose.Slides for Java можно выполнить с помощью всего нескольких строк кода.
Загрузите файл PPT, установив класс Presentation.
Получить текстовые рамки первого слайда.
Прокрутите каждую часть абзаца.
Получите требуемый результат, такой как текст, шрифт и т. д.
Системные Требования
Aspose.Slides for Java поддерживает все основные платформы и операционные системы. Пожалуйста, убедитесь, что у вас есть следующие предпосылки.
- Microsoft Windows или совместимая ОС со средой выполнения Java для приложений JSP/JSF и настольных приложений.
- Получить последнюю версию Aspose.Slides для Java прямо из Maven .
Анализ файлов PPT — Java
//Load PPT file
Presentation pptPresentation = new Presentation("demo.ppt");
try{
//Get an Array of TextFrameEx objects from the first slide
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptPresentation.getSlides().get_Item(0));
//Loop through the Array of TextFrames
for (int i = 0; i < textFramesSlideOne.length; i++){
//Loop through paragraphs in current TextFrame
for (IParagraph para : textFramesSlideOne[0].getParagraphs()){
//Loop through portions in the current Paragraph
for (IPortion port : para.getPortions()){
//Display text in the current portion
System.out.print(port.getText());
//Display font height of the text
System.out.print(port.getPortionFormat().getFontHeight());
//Display font name of the text
System.out.print(port.getPortionFormat().getLatinFont().getFontName());
}
}
}
} finally {
if (pptPresentation != null) pptPresentation.dispose();
}
//Similarly extarcting text from the Whole Presentation
//Use getAllTextFrames(pptPresentation, true) method and Iterate through Array
О Aspose.Slides for Java API
Aspose.Slides API можно использовать для чтения, записи, обработки и преобразования документов Microsoft PowerPoint в PDF, XPS, HTML, TIFF, ODP и другие различные форматы. Можно создавать новые файлы с нуля и сохранять их в соответствующих поддерживаемых форматах. Aspose.Slides — это автономный API для создания, анализа или управления презентациями, слайдами и элементами, который не зависит от какого-либо программного обеспечения, такого как Microsoft или OpenOffice.Online PPT Parser Live Demos
Extract text and images from PPT documents right now by visiting our Live Demos website . The live demo has the following benefits
PPT Формат файла PPT
A file with PPT extension represents PowerPoint file that consists of a collection of slides for displaying as SlideShow. It specifies the Binary File Format used by Microsoft PowerPoint 97-2003. A PPT file can contain several different types of information such as text, bulleted points, images, multimedia and other embedded OLE objects. Microsoft came up with newer file format for PowerPoint, known as PPTX, from 2007 onwards that is based on Office OpenXML and is different from this binary file format. Several other application programs such as OpenOffice Impress and Apple Keynote can also create PPT files.
Подробнее