PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPTX

Extrahujte text a obrázky z prezentace PPTX pomocí Python

Vytvořte si vlastní aplikace pro Python pro extrahování textových, obrazových, video a zvukových souborů z PowerPointu pomocí rozhraní API na straně serveru.

Extrahujte text z prezentace PPTX prostřednictvím Python

Chcete-li naskenovat text z celé prezentace, použijte statickou metodu GetAllTextFrames vystavenou třídou SlideUtil. Níže uvedený kód naskenuje text a informace o formátování z prezentace, včetně hlavních snímků.

Extrahování textu z prezentace PPTX pomocí Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPTX
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Jak extrahovat text z PPTX přes Python

Toto jsou kroky k analýze souborů PPTX.

  1. Načtěte PPTX s instancí Presentation

  2. Získejte pole objektů TextFrame ze všech snímků ve PPTX

  3. Procházejte polem TextFrames

  4. Procházet odstavce v aktuálním TextFrame

  5. Procházejte části v aktuálním odstavci

  6. Získejte text v aktuální části

Další podporované formáty analýzy

Pomocí Python můžete také skenovat následující formáty: