通過 Java 在 Android 上將 PDF 渲染到 WORDML

在移動應用程序中將 PDF 轉換為 WORDML,無需安裝任何軟件

 

您可以使用 Aspose.Total for Android Java 包的兩個 API 在您的移動應用程序中集成 PDF 到 WORDML 的轉換功能。首先,您需要使用 Aspose.PDF for Android via Java 將 PDF 文件轉換為 DOC。其次,通過使用文字處理 API Aspose.Words for Android via Java ,您可以將 DOC 渲染為 WORDML。

通過 Java 在 Android 上將 PDF 轉換為 WORDML

  1. Document 類打開PDF文件
  2. 使用 save 將 PDF 轉換為 DOC ) 方法
  3. 使用 Aspose.Words 的 Document 類加載 DOC 文件
  4. 使用 save 方法將文檔保存為 WORDML 格式並設置 WORDML保存格式

轉換要求

您可以直接從 Maven 通過 Java 輕鬆使用 Aspose.Total for Android 和安裝 Aspose.PDF for Android via JavaAspose.Words for Android via Java 在您的應用程序中。

或者,您可以從 下載 獲取 ZIP 文件。

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.WORD_ML
outputDocument.save("output.word_ml", SaveFormat.WORD_ML);   

通過 Java 在 Android 上獲取 PDF 文件信息

在將 PDF 轉換為 WORDML 之前,您可能需要有關文檔的信息,包括作者、創建日期、關鍵字、修改日期、主題和標題。此信息有助於轉換過程的決策。使用強大的 Aspose.PDF for Android via Java API,您可以獲得所有內容。要獲取有關 PDF 文件的文件特定信息,首先使用 getInfo 方法。一旦檢索到 DocumentInfo 對象,您就可以獲取各個屬性的值。

// load PDF document
Document doc = new Document("template.pdf");
// get document information
DocumentInfo docInfo = doc.getInfo();
// show document information
System.out.println("Author: " + docInfo.getAuthor());
System.out.println("Creation Date: " + docInfo.getCreationDate());
System.out.println("Keywords: " + docInfo.getKeywords());
System.out.println("Modify Date: " + docInfo.getModDate());
System.out.println("Subject: " + docInfo.getSubject());
System.out.println("Title: " + docInfo.getTitle());

通過 Java 在 Android 中的 WORDML 文檔中插入尾註

除了文檔轉換,您還可以使用 Aspose.Words for Android via Java API 在您的 Android 應用程序中添加許多其他功能。該功能之一是在 WORDML 文檔中插入尾註和編號。如果要在 WORDML 文檔中插入腳註或尾註,請使用 DocumentBuilder.InsertFootnote 方法。此方法在文檔中插入腳註或尾註。 EndnoteOptions 和 FootnoteOptions 類表示腳註和尾註的編號選項。

// load document
Document doc = new Document("input.DOC");
// initialize document builder
DocumentBuilder builder = new DocumentBuilder(doc);
// add text in it
builder.write("Some text");
// insert footnote
builder.insertFootnote(FootnoteType.ENDNOTE, "Endnote text.");
// initialize endnote options
EndnoteOptions option = doc.getEndnoteOptions();
// set restart rule
option.setRestartRule(FootnoteNumberingRule.RESTART_PAGE);
// set position
option.setPosition(EndnotePosition.END_OF_SECTION);
// save the document to disk.
doc.save("output.word_ml", SaveFormat.WORD_ML);  

使用 Android 探索 PDF 轉換選項

將 PDF 轉換為 ODP (OpenDocument 演示文稿格式)
將 PDF 轉換為 OTP (OpenDocument 標準格式)
將 PDF 轉換為 POT (Microsoft PowerPoint 模板文件)
將 PDF 轉換為 POTM (微軟 PowerPoint 模板文件)
將 PDF 轉換為 POTX (Microsoft PowerPoint 模板演示)
將 PDF 轉換為 PPT (PowerPoint演示文稿)
將 PDF 轉換為 PPS (PowerPoint 幻燈片放映)
將 PDF 轉換為 PPSM (啟用宏的幻燈片放映)
將 PDF 轉換為 PPSX (PowerPoint 幻燈片放映)
將 PDF 轉換為 PPT (PowerPoint演示文稿)
將 PDF 轉換為 PPTM (啟用宏的演示文稿文件)
將 PDF 轉換為 SWF (衝擊波動畫)
將 PDF 轉換為 DOCM (Microsoft Word 2007 宏文件)
將 PDF 轉換為 DOT (Microsoft Word 模板文件)
將 PDF 轉換為 DOTM (Microsoft Word 2007+ 模板文件)
將 PDF 轉換為 DOTX (微軟 Word 模板文件)
將 PDF 轉換為 FLATOPC (Microsoft Word 2003 文字處理ML)
將 PDF 轉換為 GIF (圖形交換格式)
將 PDF 轉換為 MARKDOWN (輕量級標記語言)
將 PDF 轉換為 ODT (OpenDocument 文本文件格式)
將 PDF 轉換為 OTT (打開文檔模板)
將 PDF 轉換為 PCL (打印機命令語言)
將 PDF 轉換為 PS (後記文件)
將 PDF 轉換為 RTF (富文本格式)
將 PDF 轉換為 XAMLFLOW (微軟的 Power Automate)
將 PDF 轉換為 CSV (逗號分隔值)
將 PDF 轉換為 DIF (數據交換格式)
將 PDF 轉換為 CSV (逗號分隔值)
將 PDF 轉換為 FODS (OpenDocument 平面 XML 電子表格)
將 PDF 轉換為 MD (降價語言)
將 PDF 轉換為 ODS (OpenDocument電子表格)
將 PDF 轉換為 SXC (StarSuite Calc 電子表格)
將 PDF 轉換為 TSV (製表符分隔值)
將 PDF 轉換為 TXT (文本文件)
將 PDF 轉換為 XLAM (Excel 啟用宏的加載項)
將 PDF 轉換為 XLSB (Excel 二進制工作簿)
將 PDF 轉換為 XLSM (啟用宏的電子表格)
將 PDF 轉換為 XLT (Excel 97 - 2003 模板)

什麼是 PDF 文件格式

PDF 或便攜式文檔格式是一種文件格式,旨在以一種在各種軟件應用程序、硬件設備和操作系統之間保持一致的方式呈現文檔。每個 PDF 文件都包含對固定佈局文檔的全面描述,包括文本、字體、圖形和其他準確顯示所需的信息。 PDF 最初由 Adobe Systems 在 1990 年代初期開發,用作共享計算機文檔的一種方式,同時保留文本格式和內嵌圖像。

PDF 文件通常使用 Adobe Acrobat 或類似的 PDF 創建工具等軟件生成。目前,PDF 已成為國際標準化組織 (ISO) 管理的開放標準。這種標準化確保了跨不同平台和系統的兼容性和互操作性。要查看 PDF 文件,用戶可以使用免費軟件,如 Adobe Reader 或其他可用的 PDF 查看器。

PDF 的一個顯著優勢是它的平台獨立性,允許在各種設備和設備上無縫查看和打印操作系統。無論使用何種硬件或軟件,文檔的佈局和內容都將保持不變。這種普遍的可訪問性促進了 PDF 的流行,使其成為跨不同平台和系統共享和分發文檔的首選格式。

PDF 封裝完整文檔(包括文本、字體、圖形和格式)的能力使得它是各種應用的可靠選擇。無論是共享重要報告、出版電子書、分發表格還是提供專業演示文稿,PDF 都能確保在不同環境中呈現一致的文檔呈現和可靠地保存內容。

什麼是 WORDML 文件格式

Microsoft Word 2003 引入了一種稱為 WordprocessingML 的專有文檔格式。這種基於 XML 的格式利用自定義 XML 架構來存儲 Word 文檔的各種元素,包括文本、格式、圖像和其他內容。 WordprocessingML 旨在提供所有文檔信息的綜合表示,同時保持人類可讀和機器可讀的質量。

人類可讀意味著可以使用標准文本編輯器輕鬆訪問和編輯 WordprocessingML 文檔。這種可訪問性允許用戶在需要時直接操作底層 XML 結構。此外,WordprocessingML 旨在促進計算機系統的自動處理和轉換,從而實現向其他格式的無縫轉換或與不同軟件應用程序的集成。

WordprocessingML 是一個開放標準,這意味著其規範可公開供參考和開發者實施。這種開放性促進了眾多軟件程序的開發,包括 OpenOffice.org 和 LibreOffice 等開源解決方案,它們可以讀寫 WordprocessingML 文檔。此類工具的可用性將 WordprocessingML 文件的可訪問性和互操作性擴展到 Microsoft Word 生態系統之外。

Microsoft Word 作為全球使用最廣泛的文字處理程序之一,對 WordprocessingML 作為 XML 的普及做出了貢獻基於文字處理格式。它的廣泛接受度使 WordprocessingML 成為共享和交換格式豐富的文檔的普遍標準。