Analise arquivo PPT online e extraia texto ou imagens via Python
Desenvolva um poderoso aplicativo utilitário de análise de documentos PPT baseado em Python.Código listado para imagens PPT e extração de texto através de Python.
Analisar documento PPT via aplicativo online
- Importe o arquivo PPT para análise fazendo upload dele.
- Faça isso clicando dentro da área de soltar arrastando e soltando o aplicativo analisador.
- Dependendo do tamanho do arquivo PPT e da velocidade da internet, aguarde alguns segundos.
- Clique no botão ‘Analisar agora’ para analisar o documento.
- Baixe os arquivos analisados para visualizar instantaneamente.
Extraia texto do arquivo PPT via Python
- Faça referência a APIs dentro do projeto diretamente do PyPI ( Aspose.Slides )
- Para todos os tipos de texto na apresentação, use PresentationFactory().get_presentation_text(string, TextExtractionArrangingMode)
- Carregar apresentação em um objeto da classe Presentation
- Percorra todos os slides da apresentação
- Extraia o texto de cada slide usando a matriz slides_text
Exemplo de código em Python para extrair texto PPT
import aspose.slides as slides | |
text = slides.PresentationFactory().get_presentation_text("powerpoint-presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED) | |
with slides.Presentation("presentation.pptx") as ppt: | |
for index in range(ppt.slides.length): | |
print(text.slides_text[index].text) | |
print(text.slides_text[index].layout_text) | |
print(text.slides_text[index].master_text) | |
print(text.slides_text[index].notes_text) |
Extraia imagens do PPT via Python
- Faça referência a APIs dentro do projeto diretamente do PyPI ( Aspose.Slides )
- Acessando a apresentação usando Apresentação
- Iterar em cada slide
- Obtenha a foto de trás
- Defina o formato desejado se a foto traseira estiver disponível
- Percorra todas as formas de slide e salve
Exemplo de código em Python para extrair imagens PPT
import aspose.pydrawing as draw | |
import aspose.slides as slides | |
def get_image_format(image_type): | |
return { | |
"jpeg": draw.imaging.ImageFormat.jpeg, | |
"emf": draw.imaging.ImageFormat.emf, | |
"bmp": draw.imaging.ImageFormat.bmp, | |
"png": draw.imaging.ImageFormat.png, | |
"wmf": draw.imaging.ImageFormat.wmf, | |
"gif": draw.imaging.ImageFormat.gif, | |
}.get(image_type, draw.imaging.ImageFormat.jpeg) | |
with slides.Presentation("pres.pptx") as pres: | |
slideIndex = 0 | |
image_type = "" | |
ifImageFound = False | |
for slide in pres.slides: | |
slideIndex += 1 | |
image_format = draw.imaging.ImageFormat.jpeg | |
back_image = None | |
file_name = "BackImage_Slide_{0}{1}.{2}" | |
is_layout = False | |
if slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.background.fill_format.picture_fill_format.picture.image | |
elif slide.layout_slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.layout_slide.background.fill_format.picture_fill_format.picture.image | |
is_layout = True | |
if back_image is not None: | |
image_type = back_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
back_image.system_image.save( | |
file_name.format("LayoutSlide_" if is_layout else "", slideIndex, image_type), | |
image_format) | |
for i in range(len(slide.shapes)): | |
shape = slide.shapes[i] | |
shape_image = None | |
if type(shape) is slides.AutoShape and shape.fill_format.fill_type == slides.FillType.PICTURE: | |
shape_image = shape.fill_format.picture_fill_format.picture.image | |
elif type(shape) is slides.PictureFrame: | |
shape_image = shape.picture_format.picture.image | |
if shape_image is not None: | |
image_type = shape_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
shape_image.system_image.save( | |
file_name.format("shape_"+str(i)+"_", slideIndex, image_type), | |
image_format) |
Develop PPT File Parser Application via Python
Precisa desenvolver um aplicativo ou utilitário analisador PPT?Com o
Aspose.Slides for Python via .NET
, uma API filha do
Aspose.Total for Python via .NET
, qualquer desenvolvedor python pode integrar o código da API acima em seu aplicativo analisador de documentos.A poderosa biblioteca Python permite programar qualquer solução de análise de documentos para extrair imagens e também texto.Além disso, pode suportar muitos formatos populares, incluindo o formato PPT.
Utilitário Python para processar arquivo PPT para aplicativo analisador
Existem opções alternativas para instalar “
Aspose.Slides for Python via .NET
” ou “
Aspose.Total for Python via .NET
” em seu sistema.Escolha um que se adeque às suas necessidades e siga as instruções passo a passo:
- Instale Aspose.Slides for Python via .NET do PyPI
- Ou use os seguintes comandos pip
pip install Aspose.Slides
.
Requisitos de sistema
- Python 3.5 ou posterior está instalado
- Bibliotecas de tempo de execução GCC-6 (ou posteriores).
- Para Python 3.5-3.7: A compilação pymalloc do Python é necessária.
Para obter mais detalhes, consulte Documentação do Produto .
Perguntas frequentes
- Posso usar o código Python acima em meu aplicativo?Sim, você pode baixar este código e utilizá-lo para desenvolver um aplicativo analisador de documentos baseado em Python.Este código pode servir como um recurso valioso para aprimorar a funcionalidade e os recursos de seus projetos no domínio do processamento backend de documentos, como leitura de nós e carregamento do documento para extração de texto e imagens.
- Este aplicativo analisador de documentos online funciona apenas no Windows?Você tem a flexibilidade de iniciar a análise de documentos em qualquer dispositivo, independentemente do sistema operacional em que ele é executado, seja Windows, Linux, Mac OS ou Android.Tudo o que é necessário é um navegador contemporâneo e uma conexão ativa com a Internet.
- É seguro usar o aplicativo online para analisar documentos PPT?Claro! Os arquivos de saída gerados por meio de nosso serviço serão removidos de forma segura e automática de nossos servidores dentro de um prazo de 24 horas.Como resultado, os links de exibição associados a esses arquivos deixarão de funcionar após esse período.
- Qual navegador deve usar o aplicativo?Você pode usar qualquer navegador moderno como Google Chrome, Firefox, Opera ou Safari para analisador de documentos PPT online.No entanto, se você estiver desenvolvendo um aplicativo de desktop, recomendamos usar a API de processamento de documentos Aspose.Total para um gerenciamento eficiente.