PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
ODP

Ekstrak Teks dan Gambar dari presentasi ODP menggunakan Python

Bangun aplikasi Python Anda sendiri untuk mengekstrak file teks, gambar, video, dan audio dari PowerPoint menggunakan API sisi server.

Ekstrak Teks dari Presentasi ODP melalui Python

Untuk memindai teks dari seluruh presentasi, gunakan metode statis GetAllTextFrames yang diekspos oleh kelas SlideUtil. Kode di bawah memindai teks dan memformat informasi dari presentasi, termasuk slide master.

Mengekstrak Teks dari Presentasi ODP menggunakan Python


import aspose.slides as slides

#Instatiate Presentation class that represents a ODP file
with slides.Presentation("pres.odp") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the ODP
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Cara Mengekstrak Teks dari ODP melalui Python

Ini adalah langkah-langkah untuk mengurai file ODP.

  1. Muat ODP dengan contoh Presentasi

  2. Dapatkan Array objek TextFrame dari semua slide di ODP

  3. Ulangi Array dari TextFrames

  4. Ulangi paragraf dalam TextFrame saat ini

  5. Ulangi bagian-bagian dalam Paragraf saat ini

  6. Dapatkan teks di bagian saat ini

Format Parse Lain yang Didukung

Menggunakan Python, Anda juga dapat memindai format berikut: