通過 Python 將 DOC 轉換為 TSV 或在線應用程序

無需安裝 Microsoft Word® 或 Excel,即可在 Python 應用程序中將 DOC 轉換為 TSV

 

對於嘗試在應用程序中添加 DOC 到 TSV 轉換功能的 Python 開發人員。 Aspose.Total for Python via .NET API 可以幫助自動化轉換過程。 它是處理不同格式的各種 API 的完整包。

主要分兩步。首先使用 Aspose.Words for Python via .NET API 將 DOC 文件轉換為 HTML。 之後通過使用 Excel Python API Aspose.Cells for Python via .NET ,將創建的 HTML 保存為所需的 Microsoft Excel 格式。

如何在 Python 中將 DOC 轉換為 TSV

  • 步驟 1 使用 Document 類打開源 DOC 文件
  • 通過提供文件名和所需目錄路徑,使用 Save 方法將 DOC 文件保存為 HTML
  • 步驟 2 使用 Workbook 類的實例加載 HTML 文件,並將文件和 LoadOptions 作為參數
  • 在指定輸出 TSV 文件路徑時調用 save 方法。 這樣你的DOC文件就在指定路徑下轉成TSV了

轉換要求

  • 對於 DOC 到 TSV 的轉換,需要 Python 3.5 或更高版本
  • 直接從 PyPI 引用項目中的 API( Aspose.WordsAspose.Cells
  • 或者使用以下 pip 命令pip install aspose.wordspip install aspose-cells-python
  • 此外,基於 Microsoft Windows 或 Linux 的操作系統(請參閱有關 WordsCells 的更多信息)和 Linux 檢查 gcc 和 libpython 的附加要求並遵循 分步說明
 

在 Python 中將 DOC 保存為 HTML - 第 1 步

 
 

在 Python 中將 HTML 保存為 TSV - 第 2 步

 

免費的 DOC 到 TSV 在線轉換器

經常問的問題

  • 如何在線將 DOC 轉換為 TSV?
    在上方,您會找到一個用於 DOC 轉換的集成在線應用程序。開始時,只需將 DOC 文件拖放到指定的白色區域,或在區域內單擊以導入文檔,即可添加該文件。上傳 DOC 文件後,單擊“轉換”按鈕開始 DOC 到 TSV 的轉換過程。轉換完成後,只需單擊一下即可立即下載新轉換的 TSV 文件。
  • 轉換 DOC 需要多長時間?
    我們提供的在線轉換器運行速度很快,但其性能主要取決於 DOC 文件的大小。只需幾秒鐘即可將較小的 DOC 文件轉換為 TSV。如果您將轉換代碼集成到 .NET 應用程序中,轉換速度將取決於您的應用程序針對該過程的優化程度。
  • 使用免費的 Aspose.Total 轉換器將 DOC 轉換為 TSV 是否安全?
    當然!此在線轉換器可確保您的文件安全,包括 DOC 文件轉換。您上傳的文件將在 24 小時後刪除,並且在此時間段後將無法訪問下載鏈接。請放心,沒有人可以訪問您的文件。以上免費應用程序用於測試目的,以便您可以在集成代碼之前檢查結果。
  • 我應該使用什麼瀏覽器來轉換 DOC?
    在線 DOC 到 TSV 轉換器可用於任何現代瀏覽器,如 Google Chrome、Firefox、Opera 和 Safari。但是,如果您正在開發桌面應用程序,Aspose.Total DOC Conversion API 可以為您的需求提供流暢可靠的解決方案。

使用 Python 探索 DOC 轉換選項

將 DOC 轉換為 EMAIL (電子郵件文件)
將 DOC 轉換為 EML (電子郵件信息)
將 DOC 轉換為 EMLX (Apple 郵件消息)
將 DOC 轉換為 ICS (日曆文件)
將 DOC 轉換為 MBOX (電子郵件郵箱文件)
將 DOC 轉換為 MSG (Outlook 郵件項目文件)
將 DOC 轉換為 ODP (OpenDocument 演示文稿格式)
將 DOC 轉換為 OFT (Outlook 文件模板)
將 DOC 轉換為 OST (Outlook 離線存儲表)
將 DOC 轉換為 POT (Microsoft PowerPoint 模板文件)
將 DOC 轉換為 POTM (微軟 PowerPoint 模板文件)
將 DOC 轉換為 POTX (Microsoft PowerPoint 模板演示)
將 DOC 轉換為 PPS (PowerPoint 幻燈片放映)
將 DOC 轉換為 PPSM (啟用宏的幻燈片放映)
將 DOC 轉換為 PPSX (PowerPoint 幻燈片放映)
將 DOC 轉換為 PPT (PowerPoint演示文稿)
將 DOC 轉換為 PPTM (啟用宏的演示文稿文件)
將 DOC 轉換為 PPTX (打開 XML 表示格式)
將 DOC 轉換為 PST (Outlook 個人存儲表)
將 DOC 轉換為 VCF (電子名片文件)
將 DOC 轉換為 CSV (逗號分隔值)
將 DOC 轉換為 DIF (數據交換格式)
將 DOC 轉換為 EXCEL (電子表格文件格式)
將 DOC 轉換為 FODS (OpenDocument 平面 XML 電子表格)
將 DOC 轉換為 ODS (OpenDocument電子表格)
將 DOC 轉換為 SXC (StarSuite Calc 電子表格)
將 DOC 轉換為 XLAM (Excel 啟用宏的加載項)
將 DOC 轉換為 XLS (Microsoft Excel 二進制格式)
將 DOC 轉換為 XLSB (Excel 二進制工作簿)
將 DOC 轉換為 XLSM (啟用宏的電子表格)
將 DOC 轉換為 XLSX (打開 XML 工作簿)
將 DOC 轉換為 XLT (Excel 97 - 2003 模板)
將 DOC 轉換為 XLTM (Excel 啟用宏的模板)

什麼是 DOC 文件格式

Microsoft Word 二進製文件格式 (DOC) 是 Microsoft Office Word 使用的專有文檔文件格式。它表示獨立於任何特定計算機體系結構或操作系統的文檔結構。 DOC 格式作為一個容器文件,利用二進制格式存儲各種類型的數據,包括格式化文本、圖像、圖表等。 DOC 格式的二進制性質使其無法被人類閱讀,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以讀取和寫入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此後經歷了多次修訂,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要優勢之一在於它與 Microsoft Word 的兼容性,全球使用最廣泛的文字處理應用程序之一。這種兼容性允許用戶使用 Microsoft Word 創建和修改文檔,並方便地與也使用該應用程序的其他人共享它們。此外,許多其他文字處理應用程序具有讀取和寫入 DOC 格式的能力,使其成為文檔共享目的的多功能選擇。

DOC 格式的廣泛採用源於它與 Microsoft Word 的集成,為用戶提供了一個強大且功能豐富的環境來創建和管理文檔。該格式的靈活性超越了 Microsoft Word,使用戶能夠使用其他文字處理軟件處理 DOC 文件。這種多功能性確保了用戶之間的無縫文檔協作和互換性,無論他們選擇何種文字處理應用程序。

什麼是 TSV 文件格式

製表符分隔值 (TSV) 文件是一種簡單的文本格式,用於以結構化方式存儲數據,類似於數據庫或電子表格中的表格。表格的每一行都存儲為單獨的一行,行內的列由製表符分隔。這種格式簡單易行,因為 TSV 文件可以使用文本編輯器或基本腳本進行操作。雖然沒有管理 TSV 文件的正式標準,但它們已廣受歡迎並得到眾多應用程序的廣泛支持。

TSV 文件為數據存儲和操作提供了多項優勢。首先,它們的純文本格式確保了跨不同平台和操作系統的兼容性。無論您使用的是 Windows、macOS 還是 Linux,都可以輕鬆訪問和處理 TSV 文件,而無需專門的軟件。此外,用作分隔符的製表符使得以編程方式從 TSV 文件中解析和提取特定數據變得毫不費力。

此外,TSV 文件有助於不同應用程序之間的數據交換。許多軟件工具,例如電子表格程序、數據庫管理系統和統計分析軟件,都提供對導入和導出 TSV 格式數據的內置支持。這實現了無縫互操作性,允許用戶在不同系統之間傳輸數據而不會丟失信息。