通過 Java 在 Android 上將 PDF 渲染到 MHTML

在移動應用程序中將 PDF 轉換為 MHTML,無需安裝任何軟件

 

您可以使用 Aspose.Total for Android Java 包的兩個 API 在您的移動應用程序中集成 PDF 到 MHTML 的轉換功能。首先,您需要使用 Aspose.PDF for Android via Java 將 PDF 文件轉換為 DOC。其次,通過使用文字處理 API Aspose.Words for Android via Java ,您可以將 DOC 渲染為 MHTML。

通過 Java 在 Android 上將 PDF 轉換為 MHTML

  1. Document 類打開PDF文件
  2. 使用 save 將 PDF 轉換為 DOC ) 方法
  3. 使用 Aspose.Words 的 Document 類加載 DOC 文件
  4. 使用 save 方法將文檔保存為 MHTML 格式並設置 MHTML保存格式

轉換要求

您可以直接從 Maven 通過 Java 輕鬆使用 Aspose.Total for Android 和安裝 Aspose.PDF for Android via JavaAspose.Words for Android via Java 在您的應用程序中。

或者,您可以從 下載 獲取 ZIP 文件。

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.MHTML
outputDocument.save("output.mhtml", SaveFormat.MHTML);   

通過 Java 在 Android 上獲取 PDF 文件信息

在將 PDF 轉換為 MHTML 之前,您可能需要有關文檔的信息,包括作者、創建日期、關鍵字、修改日期、主題和標題。此信息有助於轉換過程的決策。使用強大的 Aspose.PDF for Android via Java API,您可以獲得所有內容。要獲取有關 PDF 文件的文件特定信息,首先使用 getInfo 方法。一旦檢索到 DocumentInfo 對象,您就可以獲取各個屬性的值。

// load PDF document
Document doc = new Document("template.pdf");
// get document information
DocumentInfo docInfo = doc.getInfo();
// show document information
System.out.println("Author: " + docInfo.getAuthor());
System.out.println("Creation Date: " + docInfo.getCreationDate());
System.out.println("Keywords: " + docInfo.getKeywords());
System.out.println("Modify Date: " + docInfo.getModDate());
System.out.println("Subject: " + docInfo.getSubject());
System.out.println("Title: " + docInfo.getTitle());

通過 Java 在 Android 中的 MHTML 文檔中插入尾註

除了文檔轉換,您還可以使用 Aspose.Words for Android via Java API 在您的 Android 應用程序中添加許多其他功能。該功能之一是在 MHTML 文檔中插入尾註和編號。如果要在 MHTML 文檔中插入腳註或尾註,請使用 DocumentBuilder.InsertFootnote 方法。此方法在文檔中插入腳註或尾註。 EndnoteOptions 和 FootnoteOptions 類表示腳註和尾註的編號選項。

// load document
Document doc = new Document("input.DOC");
// initialize document builder
DocumentBuilder builder = new DocumentBuilder(doc);
// add text in it
builder.write("Some text");
// insert footnote
builder.insertFootnote(FootnoteType.ENDNOTE, "Endnote text.");
// initialize endnote options
EndnoteOptions option = doc.getEndnoteOptions();
// set restart rule
option.setRestartRule(FootnoteNumberingRule.RESTART_PAGE);
// set position
option.setPosition(EndnotePosition.END_OF_SECTION);
// save the document to disk.
doc.save("output.mhtml", SaveFormat.MHTML);  

使用 Android 探索 PDF 轉換選項

將 PDF 轉換為 ODP (OpenDocument 演示文稿格式)
將 PDF 轉換為 OTP (OpenDocument 標準格式)
將 PDF 轉換為 POT (Microsoft PowerPoint 模板文件)
將 PDF 轉換為 POTM (微軟 PowerPoint 模板文件)
將 PDF 轉換為 POTX (Microsoft PowerPoint 模板演示)
將 PDF 轉換為 PPT (PowerPoint演示文稿)
將 PDF 轉換為 PPS (PowerPoint 幻燈片放映)
將 PDF 轉換為 PPSM (啟用宏的幻燈片放映)
將 PDF 轉換為 PPSX (PowerPoint 幻燈片放映)
將 PDF 轉換為 PPT (PowerPoint演示文稿)
將 PDF 轉換為 PPTM (啟用宏的演示文稿文件)
將 PDF 轉換為 SWF (衝擊波動畫)
將 PDF 轉換為 DOCM (Microsoft Word 2007 宏文件)
將 PDF 轉換為 DOT (Microsoft Word 模板文件)
將 PDF 轉換為 DOTM (Microsoft Word 2007+ 模板文件)
將 PDF 轉換為 DOTX (微軟 Word 模板文件)
將 PDF 轉換為 FLATOPC (Microsoft Word 2003 文字處理ML)
將 PDF 轉換為 GIF (圖形交換格式)
將 PDF 轉換為 MARKDOWN (輕量級標記語言)
將 PDF 轉換為 ODT (OpenDocument 文本文件格式)
將 PDF 轉換為 OTT (打開文檔模板)
將 PDF 轉換為 PCL (打印機命令語言)
將 PDF 轉換為 PS (後記文件)
將 PDF 轉換為 RTF (富文本格式)
將 PDF 轉換為 WORDML (Microsoft Word 2003 文字處理ML)
將 PDF 轉換為 XAMLFLOW (微軟的 Power Automate)
將 PDF 轉換為 CSV (逗號分隔值)
將 PDF 轉換為 DIF (數據交換格式)
將 PDF 轉換為 CSV (逗號分隔值)
將 PDF 轉換為 FODS (OpenDocument 平面 XML 電子表格)
將 PDF 轉換為 MD (降價語言)
將 PDF 轉換為 ODS (OpenDocument電子表格)
將 PDF 轉換為 SXC (StarSuite Calc 電子表格)
將 PDF 轉換為 TSV (製表符分隔值)
將 PDF 轉換為 TXT (文本文件)
將 PDF 轉換為 XLAM (Excel 啟用宏的加載項)
將 PDF 轉換為 XLSB (Excel 二進制工作簿)
將 PDF 轉換為 XLSM (啟用宏的電子表格)
將 PDF 轉換為 XLT (Excel 97 - 2003 模板)

什麼是 PDF 文件格式

PDF 或便攜式文檔格式是一種文件格式,旨在以一種在各種軟件應用程序、硬件設備和操作系統之間保持一致的方式呈現文檔。每個 PDF 文件都包含對固定佈局文檔的全面描述,包括文本、字體、圖形和其他準確顯示所需的信息。 PDF 最初由 Adobe Systems 在 1990 年代初期開發,用作共享計算機文檔的一種方式,同時保留文本格式和內嵌圖像。

PDF 文件通常使用 Adobe Acrobat 或類似的 PDF 創建工具等軟件生成。目前,PDF 已成為國際標準化組織 (ISO) 管理的開放標準。這種標準化確保了跨不同平台和系統的兼容性和互操作性。要查看 PDF 文件,用戶可以使用免費軟件,如 Adobe Reader 或其他可用的 PDF 查看器。

PDF 的一個顯著優勢是它的平台獨立性,允許在各種設備和設備上無縫查看和打印操作系統。無論使用何種硬件或軟件,文檔的佈局和內容都將保持不變。這種普遍的可訪問性促進了 PDF 的流行,使其成為跨不同平台和系統共享和分發文檔的首選格式。

PDF 封裝完整文檔(包括文本、字體、圖形和格式)的能力使得它是各種應用的可靠選擇。無論是共享重要報告、出版電子書、分發表格還是提供專業演示文稿,PDF 都能確保在不同環境中呈現一致的文檔呈現和可靠地保存內容。

什麼是 MHTML 文件格式

MHTML 是 MIME HTML 的縮寫,是一種將 HTML 代碼及其相關資源組合到單個文件中的文件格式。它代表多用途 Internet 郵件擴展 HTML。 MHTML 文件通常用於將網頁(包括其所有內容,例如圖像、CSS 樣式表和 JavaScript)保存到單個文件中。

MHTML 文件通常是在用戶保存網頁以供離線使用時由網絡瀏覽器創建的查看或存檔目的。通過將所有必要的資源捆綁到一個文件中,MHTML 確保即使沒有互聯網連接或無法訪問原始服務器,也可以準確地查看和呈現網頁。

MHTML 格式遵循 MIME 標準,用於通過 Internet 編碼和交換各種類型的數據。它使用多部分 MIME 編碼將 HTML 代碼和相關資源打包到一個文件中。該文件通常具有 .mht 或 .mhtml 文件擴展名。

MHTML 文件可以通過支持該格式的網絡瀏覽器打開和查看,例如 Internet Explorer、Microsoft Edge 和 Opera。一些文本編輯器和專用軟件還提供打開和編輯 MHTML 文件的功能。

MHTML 格式在便攜性和便利性方面具有優勢,因為它允許用戶將網頁保存和共享為單個文件,確保頁面佈局、格式和鏈接資源的保存。然而,值得注意的是,MHTML 不像 HTML 或 PDF 等其他網絡格式那樣廣泛使用,並且兼容性可能因不同的軟件和平台而異。