Javaを介してMHTMLをMARKDOWNに変換する

オンプレミスのJavaAPIを使用して、サードパーティのアプリケーションを使用せずにMHTMLをMARKDOWNにレンダリングする

 

2つの簡単な手順を使用して、MHTMLをMARKDOWNに変換できます。まず、 Aspose.PDF for Java を使用してMHTMLファイルをDOCにレンダリングする必要があります。その後、強力なドキュメント処理API Aspose.Words for Java を使用して、DOCをMARKDOWNに変換できます。どちらのAPIも、 Aspose.Total for Java パッケージに含まれています。

MHTMLをMARKDOWNに変換するJavaAPI

  1. Document クラスを使用してMHTMLファイルを開きます
  2. save 方法
  3. Aspose.Wordsの Document クラスを使用してDOCファイルをロードします。
  4. save メソッドを使用してドキュメントをMARKDOWN形式で保存し、MARKDOWNを設定しますSaveFormatとして

変換要件

Maven ベースのプロジェクトから直接Aspose.Total for Javaを簡単に使用できます Aspose.PDF for JavaAspose.Words for Java あなたのpom.xmlの。

または、 ダウンロード からZIPファイルを取得することもできます。

// load MHTML file with an instance of Document class
Document document = new Document("template.mhtml");
// save MHTML as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.MARKDOWN
outputDocument.save("output.markdown", SaveFormat.MARKDOWN);   

変換要件

MHTMLをMARKDOWNに変換している間、ドキュメントがパスワードで保護されている場合でも、PDF Manipulation API Aspose.PDF for Java を使用してドキュメントを開くことができます。暗号化されたファイルを開くには、 Document オブジェクトを作成し、所有者のパスワードを使用してMHTMLを開く必要があります。

// open encrypted document
Document document = new Document("input.mhtml", "password");
// save MHTML as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Javaを介してパスワードで保護されたMHTMLドキュメントを開く

入力ドキュメントをMARKDOWNファイル形式で保存するときに、ファイルシステムの代わりにデータベースにドキュメントを保存することもできます。データベースとの間でDocumentオブジェクトの保存と取得を実装する必要がある場合があります。これは、任意のタイプのコンテンツ管理システムを実装する場合に必要になります。 MARKDOWNをデータベースに保存するには、多くの場合、ドキュメントをシリアル化してバイト配列を取得する必要があります。これは、 Aspose.Words for Java APIを使用して実行できます。バイト配列を取得したら、SQLステートメントを使用してデータベースに格納できます。

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.MARKDOWN);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

MHTML の変換オプションを Java で探索

MHTML を ODP に変換 (OpenDocument プレゼンテーション形式)
MHTML を OTP に変換 (OpenDocument標準フォーマット)
MHTML を POTM に変換 (Microsoft PowerPoint テンプレート ファイル)
MHTML を POTX に変換 (Microsoft PowerPoint テンプレートのプレゼンテーション)
MHTML を POT に変換 (Microsoft PowerPoint テンプレート ファイル)
MHTML を POWERPOINT に変換 (プレゼンテーションファイル)
MHTML を PPSM に変換 (マクロを有効にしたスライド ショー)
MHTML を PPSX に変換 (PowerPoint スライド ショー)
MHTML を PPS に変換 (PowerPoint スライド ショー)
MHTML を PPTM に変換 (マクロが有効なプレゼンテーション ファイル)
MHTML を PPT に変換 (パワーポイントによるプレゼンテーション)
MHTML を SWF に変換 (ショックウェーブフラッシュムービー)
MHTML を XAML に変換 (XAMLファイル)
MHTML を APNG に変換 (アニメーション化されたポータブル ネットワーク グラフィックス)
MHTML を DICOM に変換 (医療におけるデジタル イメージングと通信)
MHTML を DXF に変換 (Autodesk 図面交換フォーマット)
MHTML を EMZ に変換 (Windows 圧縮拡張メタファイル)
MHTML を IMAGE に変換 (画像ファイル)
MHTML を JPEG2000 に変換 (J2K画像フォーマット)
MHTML を PSD に変換 (Photoshop ドキュメント)
MHTML を SVGZ に変換 (圧縮されたスケーラブルなベクター グラフィックス)
MHTML を TGA に変換 (Truevision グラフィックス アダプター)
MHTML を WMF に変換 (Windows メタファイル)
MHTML を WMZ に変換 (圧縮された Windows メタファイル)
MHTML を CSV に変換 (カンマ区切りの値)
MHTML を DIF に変換 (データ交換フォーマット)
MHTML を DOCM に変換 (Microsoft Word 2007 マルコ ファイル)
MHTML を DOTM に変換 (Microsoft Word 2007+ テンプレート ファイル)
MHTML を DOTX に変換 (Microsoft Wordテンプレートファイル)
MHTML を DOT に変換 (Microsoft Wordテンプレートファイル)
MHTML を EXCEL に変換 (スプレッドシートのファイル形式)
MHTML を FLATOPC に変換 (Microsoft Word 2003 ワードプロセッサML)
MHTML を FODS に変換 (OpenDocument フラット XML スプレッドシート)
MHTML を GIF に変換 (グラフィカル交換フォーマット)
MHTML を MD に変換 (マークダウン言語)
MHTML を ODS に変換 (OpenDocument スプレッドシート)
MHTML を ODT に変換 (OpenDocument テキスト ファイル形式)
MHTML を OTT に変換 (OpenDocument テンプレート)
MHTML を PCL に変換 (プリンターコマンド言語)
MHTML を PS に変換 (ポストスクリプトファイル)

MHTML ファイル形式とは

MHTML は MIME HTML の略で、HTML コードとそれに関連するリソースを 1 つのファイルに結合するファイル形式です。 MultiPurpose Internet Mail Extension HTML の略です。 MHTML ファイルは、画像、CSS スタイルシート、JavaScript などのすべてのコンテンツを含む Web ページを 1 つのファイルに保存するためによく使用されます。

MHTML ファイルは、多くの場合、ユーザーがオフライン用に Web ページを保存するときに Web ブラウザによって作成されます。閲覧またはアーカイブの目的。 MHTML は、必要なすべてのリソースを 1 つのファイルにバンドルすることで、インターネット接続や元のサーバーへのアクセスがなくても、Web ページを正確に表示およびレンダリングできるようにします。

MHTML 形式は MIME 標準に従っています。インターネット上でさまざまな種類のデータをエンコードして交換するために使用されます。マルチパート MIME エンコーディングを使用して、HTML コードと関連リソースを 1 つのファイルにパッケージ化します。通常、ファイルには .mht または .mhtml のファイル拡張子が付いています。

MHTML ファイルは、Internet Explorer、Microsoft Edge、Opera など、その形式をサポートする Web ブラウザで開いて表示できます。一部のテキスト エディタや専用ソフトウェアでは、MHTML ファイルを開いて編集する機能も提供されています。

MHTML 形式では、ユーザーが Web ページを 1 つのファイルとして保存および共有できるため、移植性と利便性の点で利点があります。ページのレイアウト、書式設定、およびリンクされたリソースを確実に保持します。ただし、MHTML は HTML や PDF などの他の Web 形式ほど広く使用されておらず、互換性はソフトウェアやプラットフォームによって異なる可能性があることに注意してください。

MARKDOWN ファイル形式とは

Markdown は、書式設定されたドキュメントや Web コンテンツの作成に広く利用されている軽量のマークアップ言語で、ユーザーフレンドリーで効率的なソリューションを提供します。 Markdown の構文は単純なので、ユーザーはすぐに学習してさまざまな目的に適用できます。その多用途性は、単純なメモ、ToDo リストだけでなく、複雑な技術文書や Web ページの作成にも対応するため、重要な利点です。さらに、Markdown は、HTML、PDF、DOCX などの他の形式への簡単な変換を可能にする柔軟性を提供し、移植性を高めます。

シンプルさは、Markdown のもう 1 つの貴重な側面です。最小限の構文を採用することで、ユーザーは複雑な書式設定ルールに取り組むことなく、ドキュメントのコンテンツに集中できるようになります。このシンプルさにより、コンテンツの迅速かつ効率的な作成が容易になり、細部のフォーマットにこだわる必要がなくなります。また、Markdown は多数のツールやプラットフォームとの互換性を備えており、アクセスしやすくなっています。 Notion、Obsidian、Bear は、Markdown をサポートする一般的な書き込みおよびメモ作成アプリケーションのほんの一例にすぎません。さらに、Git などのバージョン管理システムを通じて Markdown ファイルを簡単に共有および共同作業できるため、共同作業のワークフローが合理化されます。