PPT
PPTX
ODP
POT
ppsx
PPTX
Εξαγωγή κειμένου και εικόνων από την παρουσίαση PPTX χρησιμοποιώντας Python
Δημιουργήστε τις δικές σας εφαρμογές Python για εξαγωγή αρχείων κειμένου, εικόνας, βίντεο και ήχου από το PowerPoint χρησιμοποιώντας API από την πλευρά του διακομιστή.
Εξαγωγή κειμένου από την παρουσίαση PPTX μέσω Python
Για να σαρώσετε το κείμενο από ολόκληρη την παρουσίαση, χρησιμοποιήστε τη στατική μέθοδο GetAllTextFrames που εκτίθεται από την κλάση SlideUtil. Ο παρακάτω κώδικας σαρώνει το κείμενο και τις πληροφορίες μορφοποίησης από μια παρουσίαση, συμπεριλαμβανομένων των βασικών διαφανειών.
Εξαγωγή κειμένου από την παρουσίαση PPTX χρησιμοποιώντας Python
import aspose.slides as slides
#Instatiate Presentation class that represents a PPTX file
with slides.Presentation("pres.pptx") as pptxPresentation:
# Get an Array of ITextFrame objects from all slides in the PPTX
textFramesPPTX = slides.util.SlideUtil.get_all_text_frames(pptxPresentation, True)
# Loop through the Array of TextFrames
for i in range(len(textFramesPPTX)):
# Loop through paragraphs in current ITextFrame
for para in textFramesPPTX[i].paragraphs:
# Loop through portions in the current IParagraph
for port in para.portions:
# Display text in the current portion
print(port.text)
# Display font height of the text
print(port.portion_format.font_height)
# Display font name of the text
if port.portion_format.latin_font != None:
print(port.portion_format.latin_font.font_name)
Τρόπος εξαγωγής κειμένου από το PPTX μέσω του Python
Αυτά είναι τα βήματα για την ανάλυση αρχείων PPTX.
Φόρτωση του PPTX με μια παρουσία παρουσίασης
Λάβετε μια σειρά αντικειμένων TextFrame από όλες τις διαφάνειες στο PPTX
Κάντε βρόχο μέσα από τη Συστοιχία TextFrames
Κάντε βρόχο μέσω των παραγράφων στο τρέχον TextFrame
Κάντε βρόχο μέσω τμημάτων στην τρέχουσα παράγραφο
Λάβετε κείμενο στο τρέχον τμήμα