繁體中文
  1. 產品
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   使用 Python 在線從 PPTX 檔案中提取文字和圖像

線上解析 PPTX 檔案以及透過 Python 提取文字或圖像

開發基於 Python 的強大 PPTX 文件解析器實用程式。列出了透過 Python 提取 PPTX 圖像和文字的程式碼。

透過線上應用程式解析 PPTX 文檔

  1. 透過上傳導入PPTX檔案進行解析。
  2. 透過拖放解析器應用程式在放置區域內點擊來完成此操作。
  3. 根據 PPTX 檔案的大小和網路速度,等待幾秒鐘。
  4. 按一下“立即解析”按鈕來解析文件。
  5. 下載解析的文件以立即查看。

透過 Python 從 PPTX 檔案中提取文本

  1. 直接從 PyPI ( Aspose.Slides ) 參考項目內的 API
  2. 對於簡報中的所有類型的文本,請使用 PresentationFactory().get_presentation_text(string, TextExtractionArrangingMode)
  3. 在Presentation類別物件中載入演示
  4. 循環瀏覽簡報中的所有幻燈片
  5. 使用 Slides_text 數組從每張幻燈片中提取文本
 

Python 中提取 PPTX 文字的程式碼範例

 

透過Python從PPTX中擷取影像

  1. 直接從 PyPI ( Aspose.Slides ) 參考項目內的 API
  2. 使用簡報存取簡報
  3. 迭代每張投影片
  4. 取得背面圖片
  5. 如果背面圖片可用,請設定所需的格式
  6. 循環遍歷所有投影片形狀並儲存
 

Python 中提取 PPTX 圖像的程式碼範例

 
 

Develop PPTX File Parser Application via Python

需要開發 PPTX 解析器應用程式或實用程式?透過 Aspose.Slides for Python via .NETAspose.Total for Python via .NET 的子 API),任何 Python 開發人員都可以將上述 API 程式碼整合到其文件解析器應用程式中。強大的 Python 庫允許對任何文件解析解決方案進行編程以提取圖像和文字。而且它可以支援許多流行的格式,包括PPTX格式。

用於為解析器應用程式處理 PPTX 檔案的 Python 實用程式

還有其他選項可以將“ Aspose.Slides for Python via .NET ”或“ Aspose.Total for Python via .NET ”安裝到您的系統上。請選擇符合您需求的一項並按照逐步說明進行操作:

系統需求

  • 安裝了Python 3.5或更高版本
  • GCC-6 運行時庫(或更高版本)。
  • 對於 Python 3.5-3.7:需要 Python 的 pymalloc 版本。

    欲了解更多詳情,請參閱 產品文件

常見問題解答

  • 我可以在我的應用程式中使用上述 Python 程式碼嗎?
    是的,歡迎您下載此程式碼並使用它來開發基於 Python 的文檔解析器應用程式。此程式碼可以作為寶貴的資源來增強專案在後端文件處理領域的功能和能力,例如讀取節點和載入文件以進行文字和圖像提取。
  • 這個線上文件解析器應用程式只能在 Windows 上運行嗎?
    您可以靈活地在任何裝置上啟動文件解析,無論其執行的作業系統是 Windows、Linux、Mac OS 還是 Android。所需要的只是一個現代的網路瀏覽器和一個活躍的網路連線。
  • 使用線上應用程式解析 PPTX 文件安全嗎?
    當然!透過我們的服務產生的輸出檔案將在 24 小時內安全地自動從我們的伺服器中刪除。因此,與這些文件關聯的顯示連結將在此期限後停止運行。
  • App該用什麼瀏覽器?
    您可以使用任何現代 Web 瀏覽器(例如 Google Chrome、Firefox、Opera 或 Safari)作為線上 PPTX 文件解析器。但是,如果您正在開發桌面應用程序,我們建議使用 Aspose.Total 文件處理 API 進行高效管理。

探索檔案解析器 Python 選項

解析 DOC 文件 (Microsoft Word 二進制格式)
解析 DOCX 文件 (Office 2007+ Word文檔)
解析 DOT 文件 (Microsoft Word 模板文件)
解析 DOTX 文件 (微軟 Word 模板文件)
解析 ODP 文件 (OpenDocument 演示文稿格式)
解析 ODT 文件 (OpenDocument 文本文件格式)
解析 OTT 文件 (打開文檔模板)
解析 PDF 文件 (便攜式文檔格式)
解析 PPT 文件 (PowerPoint演示文稿)
解析 PPTX 文件 (打開 XML 表示格式)
解析 RTF 文件 (富文本格式)
解析 WORD 文件 (文字處理文件格式)

什麼是 PPTX 文件格式

PPTX 文件格式是 PPT(PowerPoint 演示文稿)格式的後繼格式,Microsoft PowerPoint(Microsoft Office 套件中包含的流行演示軟件)使用它。 PPTX 文件隨著 Microsoft Office 2007 的發布而引入,基於 Open XML 文件格式。

PPTX 文件將演示文稿存儲為單個幻燈片的集合,每個幻燈片包含各種元素,例如文本、圖像、形狀、圖表、表格和多媒體內容。該格式使用基於 XML 的編碼,可實現更高效的存儲、改進的數據恢復以及增強與其他軟件應用程序的兼容性。

PPTX 格式的主要優勢之一是其文件大小比較舊的 PPT 格式。這是通過改進壓縮技術和消除冗餘數據實現的,從而產生更易於共享、傳輸和存儲的更緊湊的文件。

PPTX 文件還提供高級特性和功能,包括對增強格式的支持選項、幻燈片切換、動畫和嵌入式多媒體元素。該格式在設計和自定義演示文稿方面具有更大的靈活性,使用戶能夠創建具有視覺吸引力的交互式幻燈片。

可以使用 Microsoft PowerPoint 或跨不同平台的兼容軟件應用程序打開、編輯和演示 PPTX 文件,包括Windows、macOS 和移動設備。它們可以通過電子郵件共享,上傳到雲存儲服務,或通過協作平台訪問以實現無縫團隊合作和演示交付。