  1. 产品
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   使用 Python 在线从 PPT 文件中提取文本和图像

在线解析 PPT 文件以及通过 Python 提取文本或图像

开发强大的基于 Python 的 PPT 文档解析器实用应用程序。列出了通过 Python 提取 PPT 图像和文本的代码。

通过在线应用程序解析 PPT 文档

  1. 通过上传导入PPT文件进行解析。
  2. 通过拖放解析器应用程序在放置区域内单击来完成此操作。
  3. 根据 PPT 文件的大小和互联网速度,等待几秒钟。
  4. 单击“立即解析”按钮来解析文档。
  5. 下载解析的文件以立即查看。

通过 Python 从 PPT 文件中提取文本

  1. 直接从 PyPI ( Aspose.Slides ) 参考项目内的 API
  2. 对于演示文稿中的所有类型的文本,请使用 PresentationFactory().get_presentation_text(string, TextExtractionArrangingMode)
  3. 在Presentation类对象中加载演示
  4. 循环浏览演示文稿中的所有幻灯片
  5. 使用 Slides_text 数组从每张幻灯片中提取文本

Python 中提取 PPT 文本的代码示例

import aspose.slides as slides
text = slides.PresentationFactory().get_presentation_text("powerpoint-presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED)
with slides.Presentation("presentation.pptx") as ppt:
for index in range(ppt.slides.length):


  1. 直接从 PyPI ( Aspose.Slides ) 参考项目内的 API
  2. 使用演示文稿访问演示文稿
  3. 迭代每张幻灯片
  4. 获取背面图片
  5. 如果背面图片可用,请设置所需的格式
  6. 循环遍历所有幻灯片形状并保存

Python 中提取 PPT 图像的代码示例

import aspose.pydrawing as draw
import aspose.slides as slides
def get_image_format(image_type):
return {
"jpeg": draw.imaging.ImageFormat.jpeg,
"emf": draw.imaging.ImageFormat.emf,
"bmp": draw.imaging.ImageFormat.bmp,
"png": draw.imaging.ImageFormat.png,
"wmf": draw.imaging.ImageFormat.wmf,
"gif": draw.imaging.ImageFormat.gif,
}.get(image_type, draw.imaging.ImageFormat.jpeg)
with slides.Presentation("pres.pptx") as pres:
slideIndex = 0
image_type = ""
ifImageFound = False
for slide in pres.slides:
slideIndex += 1
image_format = draw.imaging.ImageFormat.jpeg
back_image = None
file_name = "BackImage_Slide_{0}{1}.{2}"
is_layout = False
if slide.background.fill_format.fill_type == slides.FillType.PICTURE:
back_image = slide.background.fill_format.picture_fill_format.picture.image
elif slide.layout_slide.background.fill_format.fill_type == slides.FillType.PICTURE:
back_image = slide.layout_slide.background.fill_format.picture_fill_format.picture.image
is_layout = True
if back_image is not None:
image_type = back_image.content_type.split("/")[1]
image_format = get_image_format(image_type)
file_name.format("LayoutSlide_" if is_layout else "", slideIndex, image_type),
for i in range(len(slide.shapes)):
shape = slide.shapes[i]
shape_image = None
if type(shape) is slides.AutoShape and shape.fill_format.fill_type == slides.FillType.PICTURE:
shape_image = shape.fill_format.picture_fill_format.picture.image
elif type(shape) is slides.PictureFrame:
shape_image = shape.picture_format.picture.image
if shape_image is not None:
image_type = shape_image.content_type.split("/")[1]
image_format = get_image_format(image_type)
file_name.format("shape_"+str(i)+"_", slideIndex, image_type),

Develop PPT File Parser Application via Python

需要开发 PPT 解析器应用程序或实用程序?通过 Aspose.Slides for Python via .NETAspose.Total for Python via .NET 的子 API),任何 Python 开发人员都可以将上述 API 代码集成到其文档解析器应用程序中。强大的 Python 库允许对任何文档解析解决方案进行编程以提取图像和文本。而且它可以支持许多流行的格式,包括PPT格式。

用于为解析器应用程序处理 PPT 文件的 Python 实用程序

还有其他选项可以将“ Aspose.Slides for Python via .NET ”或“ Aspose.Total for Python via .NET ”安装到您的系统上。请选择符合您需求的一项并按照分步说明进行操作:


  • 安装了Python 3.5或更高版本
  • GCC-6 运行时库(或更高版本)。
  • 对于 Python 3.5-3.7:需要 Python 的 pymalloc 版本。

    欲了解更多详情,请参阅 产品文档


  • 我可以在我的应用程序中使用上述 Python 代码吗?
    是的,欢迎您下载此代码并使用它来开发基于 Python 的文档解析器应用程序。此代码可以作为宝贵的资源来增强项目在后端文档处理领域的功能和能力,例如读取节点和加载文档以进行文本和图像提取。
  • 这个在线文档解析器应用程序只能在 Windows 上运行吗?
    您可以灵活地在任何设备上启动文档解析,无论其运行的操作系统是 Windows、Linux、Mac OS 还是 Android。所需要的只是一个现代的网络浏览器和一个活跃的互联网连接。
  • 使用在线应用程序解析 PPT 文档安全吗?
    当然!通过我们的服务生成的输出文件将在 24 小时内安全地自动从我们的服务器中删除。因此,与这些文件关联的显示链接将在此期限后停止运行。
  • App应该用什么浏览器?
    您可以使用任何现代 Web 浏览器(例如 Google Chrome、Firefox、Opera 或 Safari)作为在线 PPT 文档解析器。但是,如果您正在开发桌面应用程序,我们建议使用 Aspose.Total 文档处理 API 进行高效管理。

探索文件解析器 Python 选项

解析 DOC 文件 (Microsoft Word 二进制格式)
解析 DOCX 文件 (Office 2007+ Word文档)
解析 DOT 文件 (Microsoft Word 模板文件)
解析 DOTX 文件 (微软 Word 模板文件)
解析 ODP 文件 (OpenDocument 演示文稿格式)
解析 ODT 文件 (OpenDocument 文本文件格式)
解析 OTT 文件 (打开文档模板)
解析 PDF 文件 (便携式文档格式)
解析 PPT 文件 (PowerPoint演示文稿)
解析 PPTX 文件 (打开 XML 表示格式)
解析 RTF 文件 (富文本格式)
解析 WORD 文件 (文字处理文件格式)