נתח קובץ Powerpoint באינטרנט וכן חלץ טקסט או תמונות באמצעות Python
פתח יישום כלי עזר לנתח מסמכים Powerpoint רב עוצמה מבוסס Python. קוד רשום עבור תמונות Powerpoint וחילוץ טקסט דרך Python.
נתח מסמך Powerpoint באמצעות אפליקציה מקוונת
- ייבא קובץ Powerpoint לניתוח על ידי העלאתו.
- עשה זאת על ידי לחיצה בתוך אזור השחרור באמצעות גרירה ושחרור של אפליקציית הנתח.
- בהתאם לגודל קובץ Powerpoint ולמהירות האינטרנט המתן מספר שניות.
- לחץ על הלחצן ‘נתח עכשיו’ כדי לנתח מסמך.
- הורד את הקבצים המנותחים לצפייה מיידית.
חלץ טקסט מקובץ Powerpoint באמצעות Python
- התייחסות לממשקי API בתוך הפרויקט ישירות מ- PyPI ( Aspose.Slides )
- עבור כל סוגי הטקסט במצגת, השתמש ב-JPG1
- טען מצגת באובייקט מחלקה של Presentation
- עברו בלולאה בין כל השקופיות במצגת
- חלץ טקסט מכל שקופית באמצעות מערך slides_text
דוגמה לקוד ב-Python לחילוץ טקסט Powerpoint
import aspose.slides as slides | |
text = slides.PresentationFactory().get_presentation_text("powerpoint-presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED) | |
with slides.Presentation("presentation.pptx") as ppt: | |
for index in range(ppt.slides.length): | |
print(text.slides_text[index].text) | |
print(text.slides_text[index].layout_text) | |
print(text.slides_text[index].master_text) | |
print(text.slides_text[index].notes_text) |
חלץ תמונות מ-Powerpoint באמצעות Python
- התייחסות לממשקי API בתוך הפרויקט ישירות מ- PyPI ( Aspose.Slides )
- גישה למצגת באמצעות מצגת
- חזור על כל שקופית
- קבלו את התמונה האחורית
- הגדר את הפורמט הרצוי אם התמונה האחורית זמינה
- עברו בלולאה בכל צורות השקופיות ושמור
דוגמה לקוד ב-Python לחילוץ תמונות Powerpoint
import aspose.pydrawing as draw | |
import aspose.slides as slides | |
def get_image_format(image_type): | |
return { | |
"jpeg": draw.imaging.ImageFormat.jpeg, | |
"emf": draw.imaging.ImageFormat.emf, | |
"bmp": draw.imaging.ImageFormat.bmp, | |
"png": draw.imaging.ImageFormat.png, | |
"wmf": draw.imaging.ImageFormat.wmf, | |
"gif": draw.imaging.ImageFormat.gif, | |
}.get(image_type, draw.imaging.ImageFormat.jpeg) | |
with slides.Presentation("pres.pptx") as pres: | |
slideIndex = 0 | |
image_type = "" | |
ifImageFound = False | |
for slide in pres.slides: | |
slideIndex += 1 | |
image_format = draw.imaging.ImageFormat.jpeg | |
back_image = None | |
file_name = "BackImage_Slide_{0}{1}.{2}" | |
is_layout = False | |
if slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.background.fill_format.picture_fill_format.picture.image | |
elif slide.layout_slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.layout_slide.background.fill_format.picture_fill_format.picture.image | |
is_layout = True | |
if back_image is not None: | |
image_type = back_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
back_image.system_image.save( | |
file_name.format("LayoutSlide_" if is_layout else "", slideIndex, image_type), | |
image_format) | |
for i in range(len(slide.shapes)): | |
shape = slide.shapes[i] | |
shape_image = None | |
if type(shape) is slides.AutoShape and shape.fill_format.fill_type == slides.FillType.PICTURE: | |
shape_image = shape.fill_format.picture_fill_format.picture.image | |
elif type(shape) is slides.PictureFrame: | |
shape_image = shape.picture_format.picture.image | |
if shape_image is not None: | |
image_type = shape_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
shape_image.system_image.save( | |
file_name.format("shape_"+str(i)+"_", slideIndex, image_type), | |
image_format) |
Develop Powerpoint File Parser Application via Python
צריך לפתח אפליקציית מנתח Powerpoint או כלי שירות? עם Aspose.Slides for Python via .NET, ילד API של Aspose.Total for Python via .NET, כל מפתח פיתון יכול לשלב את קוד ה-API שלעיל בתוך אפליקציית מנתח המסמכים שלו. ספריית Python רבת עוצמה מאפשרת לתכנת כל פתרון לניתוח מסמכים כדי לחלץ תמונות כמו גם טקסט. יתר על כן, זה יכול לתמוך בפורמטים פופולריים רבים כולל פורמט Powerpoint.
כלי Python לעיבוד קובץ Powerpoint עבור אפליקציית מנתח
ישנן אפשרויות חלופיות להתקנת “Aspose.Slides for Python via .NET” או “Aspose.Total for Python via .NET” במערכת שלך. אנא בחר אחד שדומה לצרכים שלך ופעל לפי ההוראות המפורטות:
- התקן Aspose.Slides for Python via .NET מ- pypi
- או השתמש בפקודות ה-pip הבאות
pip install Aspose.Slides
.
דרישות מערכת
- מותקן Python 3.5 ואילך
- ספריות זמן ריצה של GCC-6 (או מאוחר יותר).
- עבור Python 3.5-3.7: יש צורך ב-pymalloc build של Python.
לפרטים נוספים, עיין ב- תיעוד המוצר .
שאלות נפוצות
- האם אני יכול להשתמש בקוד Python למעלה באפליקציה שלי?כן, אתה מוזמן להוריד את הקוד הזה ולהשתמש בו לצורך פיתוח אפליקציית מנתח מסמכים מבוססת Python. קוד זה יכול לשמש משאב רב ערך לשיפור הפונקציונליות והיכולות של הפרויקטים שלך בתחום עיבוד המסמכים האחוריים כגון קריאת צמתים וטעינת המסמך לחילוץ טקסט ותמונות.
- האם אפליקציית מנתח מסמכים מקוונת זו פועלת רק ב-Windows?יש לך את הגמישות ליזום ניתוח מסמכים בכל מכשיר, ללא קשר למערכת ההפעלה שעליה הוא פועל, בין אם זה Windows, Linux, Mac OS או Android. כל מה שנדרש הוא דפדפן אינטרנט עכשווי וחיבור אינטרנט פעיל.
- האם זה בטוח להשתמש באפליקציה המקוונת לניתוח מסמך Powerpoint?כמובן! קבצי הפלט שנוצרו באמצעות השירות שלנו יוסרו בצורה מאובטחת ואוטומטית מהשרתים שלנו בתוך מסגרת זמן של 24 שעות. כתוצאה מכך, קישורי התצוגה המשויכים לקבצים אלה יפסיקו לפעול לאחר תקופה זו.
- באיזה דפדפן צריך להשתמש באפליקציה?אתה יכול להשתמש בכל דפדפן אינטרנט מודרני כמו Google Chrome, Firefox, Opera או Safari עבור מנתח מסמכי Powerpoint מקוון. עם זאת, אם אתה מפתח יישום שולחן עבודה, אנו ממליצים להשתמש ב-API לעיבוד מסמכים Aspose.Total לניהול יעיל.