PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPTX

Estrai testo e immagini dalla presentazione in PPTX utilizzando Python

Crea le tue app Python per estrarre file di testo, immagini, video e audio da PowerPoint utilizzando le API lato server.

Estrai il testo dalla presentazione in PPTX tramite Python

Per eseguire la scansione del testo dell’intera presentazione, utilizza il metodo statico GetAllTextFrames esposto dalla classe SlideUtil. Il codice seguente esegue la scansione del testo e delle informazioni di formattazione da una presentazione, incluse le diapositive master.

Estrazione del testo dalla presentazione PPTX utilizzando Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPTX
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Come estrarre il testo da PPTX tramite Python

Questi sono i passaggi per analizzare i file PPTX.

  1. Carica PPTX con un’istanza di Presentation

  2. Ottieni una matrice di oggetti TextFrame da tutte le diapositive in PPTX

  3. Passa attraverso l’array di TextFrames

  4. Passa attraverso i paragrafi nel TextFrame corrente

  5. Passa attraverso le parti nel paragrafo corrente

  6. Ottieni il testo nella parte corrente

Altri formati di analisi supportati

Utilizzando Python, puoi anche scansionare i seguenti formati: