PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPTX

استخراج متن و تصاویر از ارائه PPTX با استفاده از Python

برنامه های Python خود را برای استخراج متن، تصویر، ویدیو و فایل های صوتی از پاورپوینت با استفاده از API های سمت سرور بسازید.

استخراج متن از ارائه PPTX از طریق Python

برای اسکن متن از کل ارائه، از روش ثابت GetAllTextFrames استفاده کنید که توسط کلاس SlideUtil در معرض دید قرار گرفته است. کد زیر متن و اطلاعات قالب‌بندی ارائه، از جمله اسلایدهای اصلی را اسکن می‌کند.

استخراج متن از ارائه PPTX با استفاده از Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPTX
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

نحوه استخراج متن از PPTX از طریق Python

این مراحل برای تجزیه فایل‌های PPTX هستند.

  1. PPTX را با یک نمونه از Presentation بارگیری کنید

  2. آرایه ای از اشیاء TextFrame را از همه اسلایدها در PPTX دریافت کنید

  3. از طریق آرایه TextFrames حلقه بزنید

  4. از میان پاراگراف ها در TextFrame فعلی حلقه بزنید

  5. بخش‌های پاراگراف فعلی را حلقه بزنید

  6. دریافت متن در بخش فعلی

سایر فرمت های تجزیه پشتیبانی شده

با استفاده از Python، می‌توانید قالب‌های زیر را نیز اسکن کنید: