PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
ODP

Extraia texto e imagens da apresentação ODP usando Python

Crie seus próprios aplicativos Python para extrair arquivos de texto, imagem, vídeo e áudio do PowerPoint usando APIs do lado do servidor.

Extrair texto da apresentação ODP via Python

Para digitalizar o texto de toda a apresentação, use o método estático GetAllTextFrames exposto pela classe SlideUtil. O código abaixo verifica o texto e as informações de formatação de uma apresentação, incluindo os slides mestres.

Extraindo texto da apresentação ODP usando Python


import aspose.slides as slides

#Instatiate Presentation class that represents a ODP file
with slides.Presentation("pres.odp") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the ODP
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Como extrair texto de ODP via Python

Estas são as etapas para analisar arquivos ODP.

  1. Carregar ODP com uma instância de Apresentação

  2. Obtenha uma matriz de objetos TextFrame de todos os slides no ODP

  3. Percorra a matriz de TextFrames

  4. Percorre os parágrafos no TextFrame atual

  5. Percorrer partes do parágrafo atual

  6. Obter texto na parte atual

Outros formatos de análise suportados

Usando Python, você também pode digitalizar os seguintes formatos: