PPT
PPTX
ODP
POT
ppsx
PPTX
Extrahujte text a obrázky z prezentace PPTX pomocí Python
Vytvořte si vlastní aplikace pro Python pro extrahování textových, obrazových, video a zvukových souborů z PowerPointu pomocí rozhraní API na straně serveru.
Extrahujte text z prezentace PPTX prostřednictvím Python
Chcete-li naskenovat text z celé prezentace, použijte statickou metodu GetAllTextFrames vystavenou třídou SlideUtil. Níže uvedený kód naskenuje text a informace o formátování z prezentace, včetně hlavních snímků.
Extrahování textu z prezentace PPTX pomocí Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPTX
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Jak extrahovat text z PPTX přes Python
Toto jsou kroky k analýze souborů PPTX.
Načtěte PPTX s instancí Presentation
Získejte pole objektů TextFrame ze všech snímků ve PPTX
Procházejte polem TextFrames
Procházet odstavce v aktuálním TextFrame
Procházejte části v aktuálním odstavci
Získejte text v aktuální části