Python ile PPT Dosyasını Çevrimiçi Ayrıştırmanın yanı sıra Metin veya Görüntüleri Çıkarma
Güçlü Python tabanlı PPT belge ayrıştırıcı yardımcı programı uygulaması geliştirin.PPT görüntüleri ve Python aracılığıyla metin çıkarma için listelenen kod.
PPT Belgesini Çevrimiçi Uygulamayla Ayrıştırın
- PPT dosyasını yükleyerek ayrıştırmak için içe aktarın.
- Ayrıştırıcı uygulamasının sürükleyip bırakma yöntemiyle bırakma alanının içine tıklayarak bunu yapın.
- PPT dosyasının boyutuna ve internet hızına bağlı olarak birkaç saniye bekleyin.
- Belgeyi ayrıştırmak için ‘Şimdi Ayrıştır’ düğmesini tıklayın.
- Anında görüntülemek için ayrıştırılan dosyaları indirin.
Python ile PPT Dosyasından Metin Çıkarma
- Proje içindeki API’lere doğrudan PyPI GIF’ten referans verin1
- Sunumdaki tüm metin türleri için PresentationFactory().get_presentation_text(string, TextExtractionArrangingMode) kullanın
- Sunumu bir Sunum sınıfı nesnesine yükleme
- Sunumdaki tüm slaytlar arasında geçiş yapın
- Slides_text dizisini kullanarak her slayttan metin çıkarın
PPT metnini çıkarmak için Python'daki kod örneği
import aspose.slides as slides | |
text = slides.PresentationFactory().get_presentation_text("powerpoint-presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED) | |
with slides.Presentation("presentation.pptx") as ppt: | |
for index in range(ppt.slides.length): | |
print(text.slides_text[index].text) | |
print(text.slides_text[index].layout_text) | |
print(text.slides_text[index].master_text) | |
print(text.slides_text[index].notes_text) |
Python aracılığıyla PPT'den Görüntüleri Çıkarma
- Proje içindeki API’lere doğrudan PyPI GIF’ten referans verin1
- Sunumu kullanarak sunuma erişme
- Her slaytta yineleme yapın
- Arkadaki resmi al
- Arka resim mevcutsa istediğiniz formatı ayarlayın
- Tüm slayt şekillerinde dolaşın ve kaydedin
PPT Görüntülerini çıkarmak için Python'daki kod örneği
import aspose.pydrawing as draw | |
import aspose.slides as slides | |
def get_image_format(image_type): | |
return { | |
"jpeg": draw.imaging.ImageFormat.jpeg, | |
"emf": draw.imaging.ImageFormat.emf, | |
"bmp": draw.imaging.ImageFormat.bmp, | |
"png": draw.imaging.ImageFormat.png, | |
"wmf": draw.imaging.ImageFormat.wmf, | |
"gif": draw.imaging.ImageFormat.gif, | |
}.get(image_type, draw.imaging.ImageFormat.jpeg) | |
with slides.Presentation("pres.pptx") as pres: | |
slideIndex = 0 | |
image_type = "" | |
ifImageFound = False | |
for slide in pres.slides: | |
slideIndex += 1 | |
image_format = draw.imaging.ImageFormat.jpeg | |
back_image = None | |
file_name = "BackImage_Slide_{0}{1}.{2}" | |
is_layout = False | |
if slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.background.fill_format.picture_fill_format.picture.image | |
elif slide.layout_slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.layout_slide.background.fill_format.picture_fill_format.picture.image | |
is_layout = True | |
if back_image is not None: | |
image_type = back_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
back_image.system_image.save( | |
file_name.format("LayoutSlide_" if is_layout else "", slideIndex, image_type), | |
image_format) | |
for i in range(len(slide.shapes)): | |
shape = slide.shapes[i] | |
shape_image = None | |
if type(shape) is slides.AutoShape and shape.fill_format.fill_type == slides.FillType.PICTURE: | |
shape_image = shape.fill_format.picture_fill_format.picture.image | |
elif type(shape) is slides.PictureFrame: | |
shape_image = shape.picture_format.picture.image | |
if shape_image is not None: | |
image_type = shape_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
shape_image.system_image.save( | |
file_name.format("shape_"+str(i)+"_", slideIndex, image_type), | |
image_format) |
Develop PPT File Parser Application via Python
Bir PPT ayrıştırıcı uygulaması veya yardımcı programı geliştirmeniz mi gerekiyor?
Aspose.Slides for Python via .NET
,
Aspose.Total for Python via .NET
‘ün alt API’si olduğundan, herhangi bir python geliştiricisi yukarıdaki API kodunu kendi belge ayrıştırıcı uygulamasına entegre edebilir.Güçlü Python kütüphanesi, metinlerin yanı sıra görüntüleri de çıkarmak için herhangi bir belge ayrıştırma çözümünün programlanmasına olanak tanır.Üstelik PPT formatı da dahil olmak üzere birçok popüler formatı destekleyebilir.
Ayrıştırıcı uygulaması için PPT dosyasını işlemek için Python yardımcı programı
Sisteminize “
Aspose.Slides for Python via .NET
” veya “
Aspose.Total for Python via .NET
” yüklemenin alternatif seçenekleri vardır.Lütfen ihtiyaçlarınıza uygun olanı seçin ve adım adım talimatları izleyin:
- Aspose.Slides for Python via .NET ‘ü PyPI ‘den yükleyin
- Veya Aşağıdaki pip komutlarını kullanın:
pip install Aspose.Slides
.
sistem gereksinimleri
- Python 3.5 veya üzeri yüklü
- GCC-6 çalışma zamanı kitaplıkları (veya üstü).
- Python 3.5-3.7 için: Python’un pymalloc yapısı gereklidir.
Daha fazla ayrıntı için lütfen Ürün Dokümantasyonu ’e bakın.
SSS
- Yukarıdaki Python kodunu uygulamamda kullanabilir miyim?Evet, bu kodu indirebilir ve Python tabanlı belge ayrıştırıcı uygulaması geliştirmek amacıyla kullanabilirsiniz.Bu kod, düğümlerin okunması ve metin ve görüntülerin çıkarılması için belgenin yüklenmesi gibi arka uç belge işleme alanında projelerinizin işlevselliğini ve yeteneklerini geliştirmek için değerli bir kaynak olarak hizmet edebilir.
- Bu çevrimiçi belge ayrıştırıcı Uygulaması yalnızca Windows'ta mı çalışıyor?Windows, Linux, Mac OS veya Android olsun, üzerinde çalıştığı işletim sisteminden bağımsız olarak herhangi bir cihazda belge ayrıştırmayı başlatma esnekliğine sahipsiniz.Tek gereken çağdaş bir web tarayıcısı ve aktif bir internet bağlantısıdır.
- PPT belgesini ayrıştırmak için çevrimiçi uygulamayı kullanmak güvenli midir?Elbette! Hizmetimiz aracılığıyla oluşturulan çıktı dosyaları, 24 saatlik bir süre içinde sunucularımızdan güvenli ve otomatik olarak kaldırılacaktır.Sonuç olarak, bu dosyalarla ilişkili görüntüleme bağlantıları bu sürenin sonunda artık işlevsel olmayacaktır.
- Uygulamayı hangi tarayıcı kullanmalı?Çevrimiçi PPT belge ayrıştırıcısı için Google Chrome, Firefox, Opera veya Safari gibi herhangi bir modern web tarayıcısını kullanabilirsiniz.Ancak bir masaüstü uygulaması geliştiriyorsanız verimli yönetim için Aspose.Total belge işleme API'sini kullanmanızı öneririz.