PPT
PPTX
ODP
POT
ppsx
PPTX
แยกข้อความและรูปภาพจากงานนำเสนอ PPTX โดยใช้ Python
สร้างแอป Python ของคุณเองเพื่อแยกข้อความ รูปภาพ วิดีโอ และไฟล์เสียงจาก PowerPoint โดยใช้ API ฝั่งเซิร์ฟเวอร์
แยกข้อความจากการนำเสนอ PPTX ผ่าน Python
หากต้องการสแกนข้อความจากงานนำเสนอทั้งหมด ให้ใช้เมธอดแบบสแตติก GetAllTextFrames ที่เปิดเผยโดยคลาส SlideUtil โค้ดด้านล่างจะสแกนข้อความและข้อมูลการจัดรูปแบบจากงานนำเสนอ รวมถึงสไลด์ต้นแบบ
แยกข้อความจากงานนำเสนอ PPTX โดยใช้ Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPTX
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
วิธีแยกข้อความจาก PPTX ผ่าน Python
นี่คือขั้นตอนในการแยกวิเคราะห์ไฟล์ PPTX
โหลด PPTX ด้วยอินสแตนซ์ของงานนำเสนอ
รับวัตถุ Array of TextFrame จากสไลด์ทั้งหมดใน PPTX
วนซ้ำ Array ของ TextFrames
วนซ้ำย่อหน้าใน TextFrame ปัจจุบัน
วนซ้ำส่วนต่างๆ ในย่อหน้าปัจจุบัน
รับข้อความในส่วนปัจจุบัน