Aspose.HTML for Java における HTML のマージの仕組み

Aspose.HTML for Java のマージ HTML は、複数の HTML ドキュメントを 1 つの出力ファイルに順次レンダリングするように実装されています。各HTML文書は独立して処理され、同じ出力デバイス(PDF、DOCX、XPS、または画像形式)に順番にレンダリングされます。


オンラインHTMLマージ

オンラインHTMLマージでは、ブラウザ上でリアルタイムに複数のHTMLファイルを1つのドキュメントにマージできます。ローカルファイルシステムまたは URL から HTML ファイルをロードし、必要な出力形式を選択して、例を実行します!高速、簡単、安全、そして完全無料です!結果はすぐに別のファイルとして得られます。HTMLファイルを素早く結合し、結果をPDF、XPS、DOCX、TIFF、またはMHTML形式にオンラインで保存しましょう!

JavaでHTMLファイルをマージする手順

プログラムでHTMLをマージしたい場合は、上記の例を参照してください。Aspose.HTML for Javaは、レンダリングパイプラインを使用して複数のHTMLドキュメントを処理します:

  1. HTMLDocument を用いてHTMLファイルを読み込みます。各HTMLファイルは個別のドキュメントとして読み込まれ、独自のDOMにパースされます。スタイル、画像、フォントなどのすべてのリソースは個別に解決されるので、この段階ではすべてのドキュメントは完全に分離されたままである。
  2. HtmlRendererを作成します。レンダラーは DOM ツリーを視覚的な出力に変換する処理エンジンを初期化します。レンダリングを制御しますが、ドキュメント構造のマージや変更は行いません。
  3. 出力デバイス(PDF、DOCX、XPS、画像)を選択します。出力デバイスはターゲットフォーマットを定義し、レンダリングされたコンテンツがどのようにシリアライズされるかを制御します。
  4. 複数の文書を render() に渡します。すべてのドキュメントは順次処理されます。それぞれの DOM は独立にレンダリングされ、結果の出力は選択されたデバイスが管理する単一の連続したストリームに書き込まれます。
  5. 単一の結合出力ファイルを生成します。最終的な結果は、すべての文書が入力順に従って順番に表示される1つの出力ファイルです。

複数のHTMLドキュメントのレンダリングの仕組み

Aspose.HTML for Java APIは、HTMLドキュメントのレンダリングとマージを行うための Renderer クラスを提供します。Rendererインスタンスを直接使用すると、複数のファイルを一度に出力レンダリングデバイスに送信できます。Aspose.HTML for Javaでは、各ドキュメントが独立して処理され、共有出力デバイスに書き込まれるレンダリングパイプラインモデルを使用しています。

  • 対応レンダラーHtmlRendererSvgRendererMhtmlRenderer 、および EpubRenderer で、それぞれHTML、SVG、MHTML、EPUB文書のレンダリングに使用されます。
  • サポートされる出力デバイス:PdfDevice、XpsDevice、DocDevice、およびImageDevice。各デバイスは最終的な出力フォーマットを定義します。

Aspose.HTML for Javaライブラリを使い始める

Aspose.HTML for Java は、高度な Web スクレイピングおよび HTML 解析ライブラリです。ノードを作成、編集、ナビゲートし、データを抽出し、HTML、XHTML、および MHTML ファイルを PDF、画像、およびその他の形式に変換できます。さらに、CSS、HTML Canvas、SVG、XPath、および JavaScript をすぐに使用して、操作タスクを拡張することもできます。これはスタンドアロン API であり、ソフトウェアのインストールは必要ありません。

Aspose Maven リポジトリ から最新バージョンを直接ダウンロードし、次の設定を pom.xml に追加することで、Maven ベースのプロジェクト内にインストールできます。


リポジトリ

<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>

依存

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>version of aspose-html API</version>
<classifier>jdk17</classifier>
</dependency>



よくある質問

1. Aspose.HTML for Java における「マージ HTML」とはどういう意味ですか?
マージ HTML とは、レンダリング パイプラインを使用して複数の HTML ドキュメントを 1 つの出力ファイルに順次レンダリングすることを意味します。

2. 「マージ HTML」は DOM レベルの操作ですか?
いいえ。HTML ドキュメントは単一の DOM にマージされません。各ドキュメントは独立して処理され、共有出力にレンダリングされます。

3. マージされた HTML ファイルの順序を制御できますか?
3. マージされた HTML ファイルの順序を制御できますか?
はい。入力配列内のドキュメントの順序は、最終的な出力順序を定義します。

4. マージする前にHTMLを修正できますか?
はい。各 HTMLDocument は、レンダリングの前に DOM API を使用して変更できます。

5. HTML のマージ中にスタイルは保持されますか?
はい。各ドキュメントは独自のスタイルでレンダリングされますが、視覚的な一貫性はドキュメント間でスタイルがどのように定義されているかに依存します。

6. 「Merge HTML」出力ではどの形式がサポートされますか?
Merge HTML はレンダリングデバイスを介して PDF、DOCX、XPS、および PNG、JPEG、TIFF などの画像形式をサポートします。