PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
ODP

Trích xuất văn bản và hình ảnh từ bản trình bày ODP bằng Python

Xây dựng các ứng dụng Python của riêng bạn để trích xuất các tệp văn bản, hình ảnh, video và âm thanh từ PowerPoint bằng API phía máy chủ.

Trích xuất văn bản từ bản trình bày ODP qua Python

Để quét văn bản từ toàn bộ bản trình bày, hãy sử dụng phương thức tĩnh GetAllTextFrames do lớp SlideUtil đưa ra. Mã bên dưới quét văn bản và thông tin định dạng từ bản trình bày, bao gồm các trang chiếu chính.

Trích xuất Văn bản từ Bản trình bày ODP bằng Python


import aspose.slides as slides

#Instatiate Presentation class that represents a ODP file
with slides.Presentation("pres.odp") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the ODP
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Cách trích xuất văn bản từ ODP qua Python

Đây là các bước để Phân tích tệp ODP.

  1. Tải ODP với phiên bản Trình bày

  2. Nhận một mảng các đối tượng TextFrame từ tất cả các trang chiếu trong ODP

  3. Lặp qua Mảng TextFrames

  4. Lặp qua các đoạn trong TextFrame hiện tại

  5. Lặp qua các phần trong Đoạn văn hiện tại

  6. Nhận văn bản trong phần hiện tại

Các định dạng phân tích cú pháp được hỗ trợ khác

Sử dụng Python, Bạn cũng có thể quét các định dạng sau: