PPT
PPTX
ODP
POT
ppsx
PPTX
Python kullanarak PPTX sunumundan Metin ve Resimleri Çıkarın
Sunucu tarafı API’lerini kullanarak PowerPoint’ten metin, resim, video ve ses dosyalarını ayıklamak için kendi Python uygulamalarınızı oluşturun.
Python aracılığıyla PPTX Sunumundan Metin Çıkarın
Metni sununun tamamından taramak için SlideUtil sınıfı tarafından sunulan GetAllTextFrames statik yöntemini kullanın. Aşağıdaki kod, ana slaytlar da dahil olmak üzere bir sunudaki metni ve biçimlendirme bilgilerini tarar.
Python Kullanarak PPTX Sunumundan Metin Çıkarma
import aspose.slides as slides
#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPTX
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Python aracılığıyla PPTX'dan Metin Çıkarma
Bunlar, PPTX dosyalarını Ayrıştırma adımlarıdır.
PPTX dosyasını bir Sunum örneğiyle yükleyin
PPTX içindeki tüm slaytlardan bir dizi TextFrame nesnesi alın
TextFrames Dizisinde Döngü
Geçerli TextFrame’deki paragraflar arasında geçiş yapın
Geçerli Paragraftaki bölümler arasında geçiş yapın
Geçerli kısımda metni al