PPT
PPTX
ODP
POT
ppsx
PPT
Extraiga texto e imágenes de la presentación PPT usando Python
Cree sus propias aplicaciones de Python para extraer archivos de texto, imagen, video y audio de PowerPoint utilizando las API del lado del servidor.
Extraer texto de la presentación PPT a través de Python
Para escanear el texto de toda la presentación, use el método estático GetAllTextFrames expuesto por la clase SlideUtil. El siguiente código escanea el texto y la información de formato de una presentación, incluidas las diapositivas maestras.
Extraer texto de la presentación PPT usando Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPT file
with slides.Presentation("pres.ppt") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPT
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)
    			# Display font height of the text
                print(port.portion_format.font_height)
			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)
Cómo extraer texto de PPT a través de Python
Estos son los pasos para analizar archivos PPT.
- Cargue PPT con una instancia de Presentation 
- Obtenga una matriz de objetos TextFrame de todas las diapositivas en PPT 
- Bucle a través de la matriz de TextFrames 
- Recorrer los párrafos en el TextFrame actual 
- Bucle a través de porciones en el párrafo actual 
- Obtener texto en la parte actual