在 C# 中解析 PPT 格式
使用用于 .NET API 的服务器端 Aspose.Slides 进行本机和高性能 PPT 文档解析,无需使用 Microsoft 或 Adobe PDF 等任何软件。
如何使用 C# 解析 PPT 文件
为了解析 PPT 文件,我们将使用
API 是一个功能丰富、功能强大且易于使用的 C# 平台文档操作 API。打开
包管理器,搜索 Aspose.Slides 并安装。您还可以从包管理器控制台使用以下命令。
命令
PM> Install-Package Aspose.Slides.NET
在 C# 中解析 PPT 文件的步骤
使用 Aspose.Slides for .NET API 解析基本文档只需几行代码即可完成。
加载 PPT 文件。
获取所有文本框架。
循环遍历每个段落部分。
获取所需的输出,如文本、字体等。
系统要求
所有主要平台和操作系统都支持我们的 API。在执行以下代码之前,请确保您的系统具有以下先决条件。
- Microsoft Windows 或兼容 .NET Framework、.NET Core、Windows Azure、Mono 或 Xamarin 平台的操作系统
- Microsoft Visual Studio 等开发环境
- 项目中引用的 .NET DLL 的 Aspose.Slides - 使用上面的下载按钮从 NuGet 安装
解析 PPT 文件 - C#
//Extract Text from the Whole ppt Presentation
Presentation pptPresentation = new Presentation(dataDir + "demo.ppt");
//Get an Array of ITextFrame objects from all slides in the PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptPresentation, true);
//Loop through the Array of TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)
//Loop through paragraphs in current ITextFrame
foreach (IParagraph para in textFramesPPTX[i].Paragraphs)
//Loop through portions in the current IParagraph
foreach (IPortion port in para.Portions)
{
//Display text in the current portion
Console.WriteLine(port.Text);
//Display font height of the text
Console.WriteLine(port.PortionFormat.FontHeight);
//Display font name of the text
if (port.PortionFormat.LatinFont != null)
Console.WriteLine(port.PortionFormat.LatinFont.FontName);
}
关于 Aspose.Slides for .NET API
Aspose.Slides API 可用于读取、编写、操作 Microsoft PowerPoint 文档并将其转换为 PDF、XPS、HTML、TIFF、ODP 和各种其他格式。可以从头开始创建新文件并将其保存为相关支持的格式。 Aspose.Slides 是一个独立的 API,用于创建、解析或操作演示文稿、幻灯片和元素,它不依赖于 Microsoft 或 OpenOffice 等任何软件。Online PPT Parser Live Demos
Extract text and images from PPT documents right now by visiting our Live Demos website . The live demo has the following benefits
PPT 什么是PPT文件格式
A file with PPT extension represents PowerPoint file that consists of a collection of slides for displaying as SlideShow. It specifies the Binary File Format used by Microsoft PowerPoint 97-2003. A PPT file can contain several different types of information such as text, bulleted points, images, multimedia and other embedded OLE objects. Microsoft came up with newer file format for PowerPoint, known as PPTX, from 2007 onwards that is based on Office OpenXML and is different from this binary file format. Several other application programs such as OpenOffice Impress and Apple Keynote can also create PPT files.
阅读更多