PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPTX

Wyodrębnij tekst i obrazy z prezentacji PPTX za pomocą Python

Twórz własne aplikacje Python do wyodrębniania plików tekstowych, obrazów, wideo i audio z programu PowerPoint przy użyciu interfejsów API po stronie serwera.

Wyodrębnij tekst z PPTX prezentacji przez Python

Aby zeskanować tekst z całej prezentacji, użyj metody statycznej GetAllTextFrames udostępnionej przez klasę SlideUtil. Poniższy kod skanuje tekst i informacje o formatowaniu z prezentacji, w tym ze slajdów wzorcowych.

Wyodrębnianie tekstu z prezentacji PPTX za pomocą Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPTX
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Jak wyodrębnić tekst z PPTX przez Python

Oto kroki, aby przeanalizować pliki PPTX.

  1. Załaduj PPTX z instancją Presentation

  2. Pobierz tablicę obiektów TextFrame ze wszystkich slajdów w PPTX

  3. Zapętlanie tablicy ramek tekstowych

  4. Zapętlaj akapity w bieżącej ramce TextFrame

  5. Zapętlaj fragmenty bieżącego akapitu

  6. Pobierz tekst w bieżącej części

Inne obsługiwane formaty analizy

Korzystając z Python, możesz również skanować następujące formaty: