PPT 파일을 온라인으로 구문 분석하고 Python을 통해 텍스트 또는 이미지를 추출합니다.
강력한 Python 기반 PPT 문서 파서 유틸리티 애플리케이션을 개발합니다.Python을 통한 PPT 이미지 및 텍스트 추출을 위해 나열된 코드입니다.
온라인 앱을 통해 PPT 문서 구문 분석
- PPT 파일을 업로드하여 구문 분석할 수 있습니다.
- 파서 앱의 드래그 앤 드롭을 통해 드롭 영역 내부를 클릭하여 수행합니다.
- PPT 파일의 크기와 인터넷 속도에 따라 몇 초 정도 기다립니다.
- 문서를 구문 분석하려면 ‘지금 구문 분석’ 버튼을 클릭하세요.
- 즉시 보려면 구문 분석된 파일을 다운로드하세요.
Python을 통해 PPT 파일에서 텍스트 추출
- PyPI ( Aspose.Slides )에서 직접 프로젝트 내 API 참조
- 프레젠테이션의 모든 유형의 텍스트에는 PresentationFactory().get_presentation_text(string, TextExtractionArrangingMode)을 사용하세요.
- 프레젠테이션 클래스 개체에 프레젠테이션 로드
- 프레젠테이션의 모든 슬라이드를 반복합니다.
- Slides_text 배열을 사용하여 각 슬라이드에서 텍스트를 추출합니다.
PPT 텍스트를 추출하는 Python의 코드 예제
import aspose.slides as slides | |
text = slides.PresentationFactory().get_presentation_text("powerpoint-presentation.pptx", slides.TextExtractionArrangingMode.UNARRANGED) | |
with slides.Presentation("presentation.pptx") as ppt: | |
for index in range(ppt.slides.length): | |
print(text.slides_text[index].text) | |
print(text.slides_text[index].layout_text) | |
print(text.slides_text[index].master_text) | |
print(text.slides_text[index].notes_text) |
Python을 통해 PPT에서 이미지 추출
- PyPI ( Aspose.Slides )에서 직접 프로젝트 내 API 참조
- 프레젠테이션을 사용하여 프레젠테이션에 액세스
- 각 슬라이드를 반복합니다.
- 뒷모습 사진 받아가세요
- 뒷면 사진이 있는 경우 원하는 형식을 설정하세요.
- 모든 슬라이드 모양을 반복하고 저장합니다.
PPT 이미지를 추출하는 Python의 코드 예제
import aspose.pydrawing as draw | |
import aspose.slides as slides | |
def get_image_format(image_type): | |
return { | |
"jpeg": draw.imaging.ImageFormat.jpeg, | |
"emf": draw.imaging.ImageFormat.emf, | |
"bmp": draw.imaging.ImageFormat.bmp, | |
"png": draw.imaging.ImageFormat.png, | |
"wmf": draw.imaging.ImageFormat.wmf, | |
"gif": draw.imaging.ImageFormat.gif, | |
}.get(image_type, draw.imaging.ImageFormat.jpeg) | |
with slides.Presentation("pres.pptx") as pres: | |
slideIndex = 0 | |
image_type = "" | |
ifImageFound = False | |
for slide in pres.slides: | |
slideIndex += 1 | |
image_format = draw.imaging.ImageFormat.jpeg | |
back_image = None | |
file_name = "BackImage_Slide_{0}{1}.{2}" | |
is_layout = False | |
if slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.background.fill_format.picture_fill_format.picture.image | |
elif slide.layout_slide.background.fill_format.fill_type == slides.FillType.PICTURE: | |
back_image = slide.layout_slide.background.fill_format.picture_fill_format.picture.image | |
is_layout = True | |
if back_image is not None: | |
image_type = back_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
back_image.system_image.save( | |
file_name.format("LayoutSlide_" if is_layout else "", slideIndex, image_type), | |
image_format) | |
for i in range(len(slide.shapes)): | |
shape = slide.shapes[i] | |
shape_image = None | |
if type(shape) is slides.AutoShape and shape.fill_format.fill_type == slides.FillType.PICTURE: | |
shape_image = shape.fill_format.picture_fill_format.picture.image | |
elif type(shape) is slides.PictureFrame: | |
shape_image = shape.picture_format.picture.image | |
if shape_image is not None: | |
image_type = shape_image.content_type.split("/")[1] | |
image_format = get_image_format(image_type) | |
shape_image.system_image.save( | |
file_name.format("shape_"+str(i)+"_", slideIndex, image_type), | |
image_format) |
Develop PPT File Parser Application via Python
PPT 파서 앱이나 유틸리티를 개발해야 합니까?
Aspose.Total for Python via .NET
의 하위 API인
Aspose.Slides for Python via .NET
을 사용하면 모든 Python 개발자가 문서 파서 애플리케이션 내에 위의 API 코드를 통합할 수 있습니다.강력한 Python 라이브러리를 사용하면 모든 문서 구문 분석 솔루션을 프로그래밍하여 텍스트는 물론 이미지도 추출할 수 있습니다.또한 PPT 형식을 포함하여 널리 사용되는 다양한 형식을 지원할 수 있습니다.
파서 앱용 PPT 파일을 처리하는 Python 유틸리티
시스템에 “
Aspose.Slides for Python via .NET
” 또는 “
Aspose.Total for Python via .NET
“를 설치하는 대체 옵션이 있습니다.귀하의 요구 사항과 유사한 것을 선택하고 단계별 지침을 따르십시오.
- PyPI 에서 Aspose.Slides for Python via .NET 설치
- 또는 다음 pip 명령 ```pip install Aspose.Slides``를 사용하세요.
시스템 요구 사항
- Python 3.5 이상이 설치되어 있습니다.
- GCC-6 런타임 라이브러리(또는 그 이상).
- Python 3.5-3.7의 경우: Python의 pymalloc 빌드가 필요합니다.
자세한 내용은 제품 문서 를 참고하세요.
자주 묻는 질문
- 내 애플리케이션에서 위의 Python 코드를 사용할 수 있나요?예, 이 코드를 다운로드하여 Python 기반 문서 파서 애플리케이션 개발 목적으로 활용하실 수 있습니다.이 코드는 노드 읽기, 텍스트 및 이미지 추출을 위한 문서 로드 등 백엔드 문서 처리 영역에서 프로젝트의 기능과 성능을 향상시키는 귀중한 리소스 역할을 할 수 있습니다.
- 이 온라인 문서 파서 앱은 Windows에서만 작동합니까?Windows, Linux, Mac OS, Android 등 실행되는 운영 체제에 관계없이 모든 장치에서 문서 구문 분석을 시작할 수 있는 유연성이 있습니다.필요한 것은 최신 웹 브라우저와 활성 인터넷 연결뿐입니다.
- PPT 문서를 구문 분석하기 위해 온라인 앱을 사용하는 것이 안전한가요?물론! 당사 서비스를 통해 생성된 출력 파일은 24시간 이내에 당사 서버에서 안전하고 자동으로 제거됩니다.결과적으로 해당 파일과 관련된 표시 링크는 이 기간 이후에는 더 이상 작동하지 않습니다.
- 앱을 사용하려면 어떤 브라우저를 사용해야 하나요?온라인 PPT 문서 파서에는 Google Chrome, Firefox, Opera 또는 Safari와 같은 최신 웹 브라우저를 사용할 수 있습니다.하지만 데스크톱 애플리케이션을 개발하는 경우 효율적인 관리를 위해 Aspose.Total 문서 처리 API를 사용하는 것이 좋습니다.