PPT
PPTX
ODP
POT
ppsx
PPT
Ekstrak Teks dan Gambar dari presentasi PPT menggunakan Python
Bangun aplikasi Python Anda sendiri untuk mengekstrak file teks, gambar, video, dan audio dari PowerPoint menggunakan API sisi server.
Ekstrak Teks dari Presentasi PPT melalui Python
Untuk memindai teks dari seluruh presentasi, gunakan metode statis GetAllTextFrames yang diekspos oleh kelas SlideUtil. Kode di bawah memindai teks dan memformat informasi dari presentasi, termasuk slide master.
Mengekstrak Teks dari Presentasi PPT menggunakan Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPT file
with slides.Presentation("pres.ppt") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPT
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Cara Mengekstrak Teks dari PPT melalui Python
Ini adalah langkah-langkah untuk mengurai file PPT.
Muat PPT dengan contoh Presentasi
Dapatkan Array objek TextFrame dari semua slide di PPT
Ulangi Array dari TextFrames
Ulangi paragraf dalam TextFrame saat ini
Ulangi bagian-bagian dalam Paragraf saat ini
Dapatkan teks di bagian saat ini