PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPT

Extraiga texto e imágenes de la presentación PPT usando Python

Cree sus propias aplicaciones de Python para extraer archivos de texto, imagen, video y audio de PowerPoint utilizando las API del lado del servidor.

Extraer texto de la presentación PPT a través de Python

Para escanear el texto de toda la presentación, use el método estático GetAllTextFrames expuesto por la clase SlideUtil. El siguiente código escanea el texto y la información de formato de una presentación, incluidas las diapositivas maestras.

Extraer texto de la presentación PPT usando Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPT file
with slides.Presentation("pres.ppt") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPT
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Cómo extraer texto de PPT a través de Python

Estos son los pasos para analizar archivos PPT.

  1. Cargue PPT con una instancia de Presentation

  2. Obtenga una matriz de objetos TextFrame de todas las diapositivas en PPT

  3. Bucle a través de la matriz de TextFrames

  4. Recorrer los párrafos en el TextFrame actual

  5. Bucle a través de porciones en el párrafo actual

  6. Obtener texto en la parte actual

Otros formatos de análisis admitidos

Usando Python, también puede escanear los siguientes formatos: