PPT
PPTX
ODP
POT
ppsx
ODP
Wyodrębnij tekst i obrazy z prezentacji ODP za pomocą Python
Twórz własne aplikacje Python do wyodrębniania plików tekstowych, obrazów, wideo i audio z programu PowerPoint przy użyciu interfejsów API po stronie serwera.
Wyodrębnij tekst z ODP prezentacji przez Python
Aby zeskanować tekst z całej prezentacji, użyj metody statycznej GetAllTextFrames udostępnionej przez klasę SlideUtil. Poniższy kod skanuje tekst i informacje o formatowaniu z prezentacji, w tym ze slajdów wzorcowych.
Wyodrębnianie tekstu z prezentacji ODP za pomocą Python
import aspose.slides as slides
#Instatiate Presentation class that represents a ODP file
with slides.Presentation("pres.odp") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the ODP
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Jak wyodrębnić tekst z ODP przez Python
Oto kroki, aby przeanalizować pliki ODP.
Załaduj ODP z instancją Presentation
Pobierz tablicę obiektów TextFrame ze wszystkich slajdów w ODP
Zapętlanie tablicy ramek tekstowych
Zapętlaj akapity w bieżącej ramce TextFrame
Zapętlaj fragmenty bieżącego akapitu
Pobierz tekst w bieżącej części