Проаналізуйте файл PPT онлайн, а також витягніть текст або зображення за допомогою Python
Розробіть потужну утиліту аналізатора документів PPT на основі Python. Перерахований код для зображень PPT і вилучення тексту через Python.
Проаналізуйте документ PPT через онлайн-додаток
- Імпортуйте файл PPT для аналізу, завантаживши його.
- Зробіть це, клацнувши всередині області перетягування за допомогою програми аналізатора.
- Залежно від розміру файлу PPT і швидкості Інтернету зачекайте кілька секунд.
- Натисніть кнопку «Проаналізувати зараз», щоб проаналізувати документ.
- Завантажте проаналізовані файли для миттєвого перегляду.
Витягніть текст із файлу PPT за допомогою Python
- Посилання на API в рамках проекту безпосередньо з PyPI ( Aspose.Slides )
- Для всіх типів тексту в презентації використовуйте JPG1
- Завантажити презентацію в об’єкт класу Presentation
- Перегляньте всі слайди презентації
- Витягніть текст із кожного слайда за допомогою масиву slides_text
Приклад коду в Python для вилучення тексту PPT
import aspose.slides as slides | |
text = slides.PresentationFactory().get_presentation_text("powerpoint-presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED) | |
with slides.Presentation("presentation.pptx") as ppt: | |
for index in range(ppt.slides.length): | |
print(text.slides_text[index].text) | |
print(text.slides_text[index].layout_text) | |
print(text.slides_text[index].master_text) | |
print(text.slides_text[index].notes_text) |
Видобувати зображення з PPT за допомогою Python
- Посилання на API в рамках проекту безпосередньо з PyPI ( Aspose.Slides )
- Доступ до презентації за допомогою Презентації
- Повторюйте кожен слайд
- Отримайте заднє зображення
- Встановіть потрібний формат, якщо доступне заднє зображення
- Перегляньте всі форми слайда та збережіть
Приклад коду в Python для вилучення зображень PPT
import aspose.pydrawing as draw | |
import aspose.slides as slides | |
def get_image_format(image_type): | |
return { | |
"jpeg": draw.imaging.ImageFormat.jpeg, | |
"emf": draw.imaging.ImageFormat.emf, | |
"bmp": draw.imaging.ImageFormat.bmp, | |
"png": draw.imaging.ImageFormat.png, | |
"wmf": draw.imaging.ImageFormat.wmf, | |
"gif": draw.imaging.ImageFormat.gif, | |
}.get(image_type, draw.imaging.ImageFormat.jpeg) | |
with slides.Presentation("pres.pptx") as pres: | |
slideIndex = 0 | |
image_type = "" | |
ifImageFound = False | |
for slide in pres.slides: | |
slideIndex += 1 | |
image_format = draw.imaging.ImageFormat.jpeg | |
back_image = None | |
file_name = "BackImage_Slide_{0}{1}.{2}" | |
is_layout = False | |
if slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.background.fill_format.picture_fill_format.picture.image | |
elif slide.layout_slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.layout_slide.background.fill_format.picture_fill_format.picture.image | |
is_layout = True | |
if back_image is not None: | |
image_type = back_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
back_image.system_image.save( | |
file_name.format("LayoutSlide_" if is_layout else "", slideIndex, image_type), | |
image_format) | |
for i in range(len(slide.shapes)): | |
shape = slide.shapes[i] | |
shape_image = None | |
if type(shape) is slides.AutoShape and shape.fill_format.fill_type == slides.FillType.PICTURE: | |
shape_image = shape.fill_format.picture_fill_format.picture.image | |
elif type(shape) is slides.PictureFrame: | |
shape_image = shape.picture_format.picture.image | |
if shape_image is not None: | |
image_type = shape_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
shape_image.system_image.save( | |
file_name.format("shape_"+str(i)+"_", slideIndex, image_type), | |
image_format) |
Develop PPT File Parser Application via Python
Потрібно розробити програму чи утиліту синтаксичного аналізатора PPT? Завдяки Aspose.Slides for Python via .NET, дочірньому API Aspose.Total for Python via .NET, будь-який розробник python може інтегрувати вищезгаданий код API у свою програму аналізатора документів. Потужна бібліотека Python дозволяє програмувати будь-яке рішення аналізу документів для вилучення зображень, а також тексту. Крім того, він може підтримувати багато популярних форматів, включаючи формат PPT.
Утиліта Python для обробки файлу PPT для програми аналізатора
Існують альтернативні варіанти встановлення «Aspose.Slides for Python via .NET» або «Aspose.Total for Python via .NET» у вашу систему. Виберіть той, який відповідає вашим потребам, і дотримуйтеся покрокових інструкцій:
- Встановіть Aspose.Slides for Python via .NET з pypi
- Або скористайтеся наступними командами pip
pip install Aspose.Slides
.
Системні вимоги
- Встановлено Python 3.5 або новішої версії
- Бібліотеки середовища виконання GCC-6 (або новіші).
- Для Python 3.5-3.7: потрібна збірка pymalloc для Python.
Для отримання додаткової інформації зверніться до Документація продукту .
поширені запитання
- Чи можу я використовувати наведений вище код Python у своїй програмі?Так, ви можете завантажити цей код і використати його для розробки програми аналізатора документів на основі Python. Цей код може слугувати цінним ресурсом для покращення функціональності та можливостей ваших проектів у сфері обробки документів на сервері, наприклад читання вузлів і завантаження документа для вилучення тексту та зображень.
- Чи працює цей онлайн-додаток аналізатора документів лише в Windows?У вас є можливість ініціювати розбір документів на будь-якому пристрої, незалежно від операційної системи, на якій він працює, будь то Windows, Linux, Mac OS або Android. Все, що потрібно, це сучасний веб-браузер і активне підключення до Інтернету.
- Чи безпечно використовувати онлайн-програму для аналізу документа PPT?Звичайно! Вихідні файли, створені за допомогою нашої служби, будуть безпечно та автоматично видалені з наших серверів протягом 24 годин. У результаті відображувані посилання, пов’язані з цими файлами, перестануть працювати після закінчення цього періоду.
- Який браузер потрібно використовувати для використання програми?Ви можете використовувати будь-який сучасний веб-браузер, як-от Google Chrome, Firefox, Opera або Safari, для онлайн-аналізатора документів PPT. Однак, якщо ви розробляєте настільну програму, ми рекомендуємо використовувати API обробки документів Aspose.Total для ефективного керування.