在 C# 中解析 PPTX 格式
使用用于 .NET API 的服务器端 Aspose.Slides 进行本机和高性能 PPTX 文档解析,无需使用 Microsoft 或 Adobe PDF 等任何软件。
如何使用 C# 解析 PPTX 文件
为了解析 PPTX 文件,我们将使用
API 是一个功能丰富、功能强大且易于使用的 C# 平台文档操作 API。打开
包管理器,搜索 Aspose.Slides 并安装。您还可以从包管理器控制台使用以下命令。
命令
PM> Install-Package Aspose.Slides.NET
在 C# 中解析 PPTX 文件的步骤
使用 Aspose.Slides for .NET API 解析基本文档只需几行代码即可完成。
加载 PPTX 文件。
获取所有文本框架。
循环遍历每个段落部分。
获取所需的输出,如文本、字体等。
系统要求
所有主要平台和操作系统都支持我们的 API。在执行以下代码之前,请确保您的系统具有以下先决条件。
- Microsoft Windows 或兼容 .NET Framework、.NET Core、Windows Azure、Mono 或 Xamarin 平台的操作系统
- Microsoft Visual Studio 等开发环境
- 项目中引用的 .NET DLL 的 Aspose.Slides - 使用上面的下载按钮从 NuGet 安装
解析 PPTX 文件 - C#
//Extract Text from the Whole pptx Presentation
Presentation pptxPresentation = new Presentation(dataDir + "demo.pptx");
//Get an Array of ITextFrame objects from all slides in the PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);
//Loop through the Array of TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
//Loop through paragraphs in current ITextFrame
foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
//Loop through portions in the current IParagraph
foreach (IPortion port in para.Portions)
{
//Display text in the current portion
Console.WriteLine(port.Text);
//Display font height of the text
Console.WriteLine(port.PortionFormat.FontHeight);
//Display font name of the text
if (port.PortionFormat.LatinFont != null)
Console.WriteLine(port.PortionFormat.LatinFont.FontName);
}
关于 Aspose.Slides for .NET API
Aspose.Slides API 可用于读取、编写、操作 Microsoft PowerPoint 文档并将其转换为 PDF、XPS、HTML、TIFF、ODP 和各种其他格式。可以从头开始创建新文件并将其保存为相关支持的格式。 Aspose.Slides 是一个独立的 API,用于创建、解析或操作演示文稿、幻灯片和元素,它不依赖于 Microsoft 或 OpenOffice 等任何软件。Online PPTX Parser Live Demos
Extract text and images from PPTX documents right now by visiting our Live Demos website . The live demo has the following benefits
PPTX 什么是PPTX文件格式
Files with PPTX extension are presentation files created with popular Microsoft PowerPoint application. Unlike the previous version of presentation file format PPT which was binary, the PPTX format is based on the Microsoft PowerPoint open XML presentation file format. A presentation file is a collection of slides where each slide can comprise of text, images, formatting, animations, and other media. These slides are presented to audience in the form of slideshows with custom presentation settings.
阅读更多