Анализ форматов PPTX в Java
Встроенный и высокопроизводительный анализ документов PPTX с использованием серверных API-интерфейсов Aspose.Slides for Java без использования какого-либо программного обеспечения, такого как Microsoft или Adobe PDF.
Как разобрать файл PPTX с помощью Java
Чтобы разобрать файл PPTX, мы будем использовать
API, который представляет собой многофункциональный, мощный и простой в использовании API синтаксического анализа для платформы Java. Вы можете скачать его последнюю версию прямо с
и установите его в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml.
Репозиторий
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
Зависимость
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-slides</artifactId>
<version>version of aspose-slides API</version>
<classifier>jdk17</classifier>
</dependency>
Шаги для разбора файлов PPTX в Java
Базовый синтаксический анализ документа с помощью API Aspose.Slides for Java можно выполнить с помощью всего нескольких строк кода.
Загрузите файл PPTX, установив класс Presentation.
Получить текстовые рамки первого слайда.
Прокрутите каждую часть абзаца.
Получите требуемый результат, такой как текст, шрифт и т. д.
Системные Требования
Aspose.Slides for Java поддерживает все основные платформы и операционные системы. Пожалуйста, убедитесь, что у вас есть следующие предпосылки.
- Microsoft Windows или совместимая ОС со средой выполнения Java для приложений JSP/JSF и настольных приложений.
- Получить последнюю версию Aspose.Slides для Java прямо из Maven .
Анализ файлов PPTX — Java
//Load PPTX file
Presentation pptxPresentation = new Presentation("demo.pptx");
try{
//Get an Array of TextFrameEx objects from the first slide
ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(0));
//Loop through the Array of TextFrames
for (int i = 0; i < textFramesSlideOne.length; i++){
//Loop through paragraphs in current TextFrame
for (IParagraph para : textFramesSlideOne[0].getParagraphs()){
//Loop through portions in the current Paragraph
for (IPortion port : para.getPortions()){
//Display text in the current portion
System.out.print(port.getText());
//Display font height of the text
System.out.print(port.getPortionFormat().getFontHeight());
//Display font name of the text
System.out.print(port.getPortionFormat().getLatinFont().getFontName());
}
}
}
} finally {
if (pptxPresentation != null) pptxPresentation.dispose();
}
//Similarly extarcting text from the Whole Presentation
//Use getAllTextFrames(pptxPresentation, true) method and Iterate through Array
О Aspose.Slides for Java API
Aspose.Slides API можно использовать для чтения, записи, обработки и преобразования документов Microsoft PowerPoint в PDF, XPS, HTML, TIFF, ODP и другие различные форматы. Можно создавать новые файлы с нуля и сохранять их в соответствующих поддерживаемых форматах. Aspose.Slides — это автономный API для создания, анализа или управления презентациями, слайдами и элементами, который не зависит от какого-либо программного обеспечения, такого как Microsoft или OpenOffice.Online PPTX Parser Live Demos
Extract text and images from PPTX documents right now by visiting our Live Demos website . The live demo has the following benefits
PPTX Формат файла PPTX
Files with PPTX extension are presentation files created with popular Microsoft PowerPoint application. Unlike the previous version of presentation file format PPT which was binary, the PPTX format is based on the Microsoft PowerPoint open XML presentation file format. A presentation file is a collection of slides where each slide can comprise of text, images, formatting, animations, and other media. These slides are presented to audience in the form of slideshows with custom presentation settings.
Подробнее