PPT
PPTX
ODP
POT
ppsx
ODP
Extrahera text och bilder från presentationen ODP med Python
Bygg dina egna Python-appar för att extrahera text-, bild-, video- och ljudfiler från PowerPoint med API:er på serversidan.
Extrahera text från ODP presentation via Python
För att skanna texten från hela presentationen, använd den statiska metoden GetAllTextFrames som exponeras av SlideUtil-klassen. Koden nedan skannar text- och formateringsinformation från en presentation, inklusive huvudbilderna.
Extrahera text från ODP presentation med Python
import aspose.slides as slides
#Instatiate Presentation class that represents a ODP file
with slides.Presentation("pres.odp") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the ODP
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Så här extraherar du text från ODP via Python
Det här är stegen för att analysera ODP-filer.
Ladda ODP med en instans av Presentation
Få en uppsättning TextFrame-objekt från alla bilder i ODP
Gå igenom arrayen av textramar
Gå igenom stycken i nuvarande TextFrame
Gå igenom delar i det aktuella stycket
Hämta text i den aktuella delen