PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPT

Python kullanarak PPT sunumundan Metin ve Resimleri Çıkarın

Sunucu tarafı API’lerini kullanarak PowerPoint’ten metin, resim, video ve ses dosyalarını ayıklamak için kendi Python uygulamalarınızı oluşturun.

Python aracılığıyla PPT Sunumundan Metin Çıkarın

Metni sununun tamamından taramak için SlideUtil sınıfı tarafından sunulan GetAllTextFrames statik yöntemini kullanın. Aşağıdaki kod, ana slaytlar da dahil olmak üzere bir sunudaki metni ve biçimlendirme bilgilerini tarar.

Python Kullanarak PPT Sunumundan Metin Çıkarma


import aspose.slides as slides

#Instatiate Presentation class that represents a PPT file
with slides.Presentation("pres.ppt") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPT
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Python aracılığıyla PPT'dan Metin Çıkarma

Bunlar, PPT dosyalarını Ayrıştırma adımlarıdır.

  1. PPT dosyasını bir Sunum örneğiyle yükleyin

  2. PPT içindeki tüm slaytlardan bir dizi TextFrame nesnesi alın

  3. TextFrames Dizisinde Döngü

  4. Geçerli TextFrame’deki paragraflar arasında geçiş yapın

  5. Geçerli Paragraftaki bölümler arasında geçiş yapın

  6. Geçerli kısımda metni al

Diğer Desteklenen Ayrıştırma Biçimleri

Python kullanarak aşağıdaki biçimleri de tarayabilirsiniz: