PPT PPTX ODP POT ppsx
Aspose.Slides  for Python via .NET
PPTX

Εξαγωγή κειμένου και εικόνων από την παρουσίαση PPTX χρησιμοποιώντας Python

Δημιουργήστε τις δικές σας εφαρμογές Python για εξαγωγή αρχείων κειμένου, εικόνας, βίντεο και ήχου από το PowerPoint χρησιμοποιώντας API από την πλευρά του διακομιστή.

Εξαγωγή κειμένου από την παρουσίαση PPTX μέσω Python

Για να σαρώσετε το κείμενο από ολόκληρη την παρουσίαση, χρησιμοποιήστε τη στατική μέθοδο GetAllTextFrames που εκτίθεται από την κλάση SlideUtil. Ο παρακάτω κώδικας σαρώνει το κείμενο και τις πληροφορίες μορφοποίησης από μια παρουσίαση, συμπεριλαμβανομένων των βασικών διαφανειών.

Εξαγωγή κειμένου από την παρουσίαση PPTX χρησιμοποιώντας Python


import aspose.slides as slides

#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
    # Get an Array of ITextFrame objects from all slides in the PPTX
    textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
    
    # Loop through the Array of TextFrames
    for i in range(len(textFramesPPTX)):
	    # Loop through paragraphs in current ITextFrame
        for para in textFramesPPTX[i].paragraphs:
            # Loop through portions in the current IParagraph
            for port in para.portions:
			    # Display text in the current portion
                print(port.text)

    			# Display font height of the text
                print(port.portion_format.font_height)

			    # Display font name of the text
                if port.portion_format.latin_font != None:
                    print(port.portion_format.latin_font.font_name)

Τρόπος εξαγωγής κειμένου από το PPTX μέσω του Python

Αυτά είναι τα βήματα για την ανάλυση αρχείων PPTX.

  1. Φόρτωση του PPTX με μια παρουσία παρουσίασης

  2. Λάβετε μια σειρά αντικειμένων TextFrame από όλες τις διαφάνειες στο PPTX

  3. Κάντε βρόχο μέσα από τη Συστοιχία TextFrames

  4. Κάντε βρόχο μέσω των παραγράφων στο τρέχον TextFrame

  5. Κάντε βρόχο μέσω τμημάτων στην τρέχουσα παράγραφο

  6. Λάβετε κείμενο στο τρέχον τμήμα

Άλλες υποστηριζόμενες μορφές ανάλυσης

Χρησιμοποιώντας το Python, μπορείτε επίσης να σαρώσετε τις ακόλουθες μορφές: