PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPT

Εξαγωγή κειμένου και εικόνων από την παρουσίαση PPT χρησιμοποιώντας Python

Δημιουργήστε τις δικές σας εφαρμογές Python για εξαγωγή αρχείων κειμένου, εικόνας, βίντεο και ήχου από το PowerPoint χρησιμοποιώντας API από την πλευρά του διακομιστή.

Εξαγωγή κειμένου από την παρουσίαση PPT μέσω Python

Για να σαρώσετε το κείμενο από ολόκληρη την παρουσίαση, χρησιμοποιήστε τη στατική μέθοδο GetAllTextFrames που εκτίθεται από την κλάση SlideUtil. Ο παρακάτω κώδικας σαρώνει το κείμενο και τις πληροφορίες μορφοποίησης από μια παρουσίαση, συμπεριλαμβανομένων των βασικών διαφανειών.

Εξαγωγή κειμένου από την παρουσίαση PPT χρησιμοποιώντας Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPT file
with slides.Presentation("pres.ppt") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPT
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Τρόπος εξαγωγής κειμένου από το PPT μέσω του Python

Αυτά είναι τα βήματα για την ανάλυση αρχείων PPT.

  1. Φόρτωση του PPT με μια παρουσία παρουσίασης

  2. Λάβετε μια σειρά αντικειμένων TextFrame από όλες τις διαφάνειες στο PPT

  3. Κάντε βρόχο μέσα από τη Συστοιχία TextFrames

  4. Κάντε βρόχο μέσω των παραγράφων στο τρέχον TextFrame

  5. Κάντε βρόχο μέσω τμημάτων στην τρέχουσα παράγραφο

  6. Λάβετε κείμενο στο τρέχον τμήμα

Άλλες υποστηριζόμενες μορφές ανάλυσης

Χρησιμοποιώντας το Python, μπορείτε επίσης να σαρώσετε τις ακόλουθες μορφές: