PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
ODP

Extrahieren Sie Text und Bilder aus der ODP-Präsentation mit Python

Erstellen Sie mithilfe serverseitiger APIs Ihre eigenen Python-Apps zum Extrahieren von Text-, Bild-, Video- und Audiodateien aus PowerPoint.

Text aus ODP-Präsentation über Python extrahieren

Um den Text der gesamten Präsentation zu scannen, verwenden Sie die statische Methode GetAllTextFrames , die von der SlideUtil-Klasse verfügbar gemacht wird. Der folgende Code scannt den Text und die Formatierungsinformationen aus einer Präsentation, einschließlich der Masterfolien.

Extrahieren von Text aus ODP-Präsentation mit Python


import aspose.slides as slides

#Instatiate Presentation class that represents a ODP file
with slides.Presentation("pres.odp") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the ODP
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

So extrahieren Sie Text aus ODP über Python

Dies sind die Schritte zum Analysieren von ODP-Dateien.

  1. Laden Sie ODP mit einer Präsentationsinstanz

  2. Holen Sie sich ein Array von TextFrame-Objekten von allen Folien im ODP

  3. Durchlaufen Sie das Array von TextFrames

  4. Absätze im aktuellen TextFrame durchlaufen

  5. Teile im aktuellen Absatz durchlaufen

  6. Holen Sie sich Text im aktuellen Teil

Andere unterstützte Parse-Formate

Mit Python können Sie auch die folgenden Formate scannen: