PPT
PPTX
ODP
POT
ppsx
PPT
Estrai testo e immagini dalla presentazione in PPT utilizzando Python
Crea le tue app Python per estrarre file di testo, immagini, video e audio da PowerPoint utilizzando le API lato server.
Estrai il testo dalla presentazione in PPT tramite Python
Per eseguire la scansione del testo dell’intera presentazione, utilizza il metodo statico GetAllTextFrames esposto dalla classe SlideUtil. Il codice seguente esegue la scansione del testo e delle informazioni di formattazione da una presentazione, incluse le diapositive master.
Estrazione del testo dalla presentazione PPT utilizzando Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPT file
with slides.Presentation("pres.ppt") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPT
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Come estrarre il testo da PPT tramite Python
Questi sono i passaggi per analizzare i file PPT.
Carica PPT con un’istanza di Presentation
Ottieni una matrice di oggetti TextFrame da tutte le diapositive in PPT
Passa attraverso l’array di TextFrames
Passa attraverso i paragrafi nel TextFrame corrente
Passa attraverso le parti nel paragrafo corrente
Ottieni il testo nella parte corrente