PPT
PPTX
ODP
POT
ppsx
PPTX
استخراج متن و تصاویر از ارائه PPTX با استفاده از Python
برنامه های Python خود را برای استخراج متن، تصویر، ویدیو و فایل های صوتی از پاورپوینت با استفاده از API های سمت سرور بسازید.
استخراج متن از ارائه PPTX از طریق Python
برای اسکن متن از کل ارائه، از روش ثابت GetAllTextFrames استفاده کنید که توسط کلاس SlideUtil در معرض دید قرار گرفته است. کد زیر متن و اطلاعات قالببندی ارائه، از جمله اسلایدهای اصلی را اسکن میکند.
استخراج متن از ارائه PPTX با استفاده از Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPTX
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
نحوه استخراج متن از PPTX از طریق Python
این مراحل برای تجزیه فایلهای PPTX هستند.
PPTX را با یک نمونه از Presentation بارگیری کنید
آرایه ای از اشیاء TextFrame را از همه اسلایدها در PPTX دریافت کنید
از طریق آرایه TextFrames حلقه بزنید
از میان پاراگراف ها در TextFrame فعلی حلقه بزنید
بخشهای پاراگراف فعلی را حلقه بزنید
دریافت متن در بخش فعلی