HTML JPG PDF XML XLSX
  Product Family
DOCX

Python Excel ライブラリで HTML を DOCX に変換する

HTML を DOCX に変換するための高速 Python Excel ライブラリ。Excel 変換 API を使用して、Python で高レベルのプラットフォームに依存しないソフトウェアを開発します。

Python Excel ライブラリで HTML を DOCX に変換する

HTML を DOCX に変換するにはどうすればよいですか? NET ライブラリを介して Aspose.Cells for Python を使用すると、数行のコードでプログラム的に HTML を DOCX に簡単に変換できます。 Aspose.Cells for Python NET経由 すべての Excel ファイルを生成、変更、変換、レンダリング、印刷する機能を備えたクロスプラットフォーム アプリケーションを構築できます。 Python Excel API は、スプレッドシート形式間の変換だけでなく、Excel ファイルを画像としてレンダリングすることもできます。 PDF, HTML, ODS, CSV, SVG, JSON, WORD, PPT そのため、業界標準の形式でドキュメントを交換するのに最適です。

HTML から DOCX を Python Excel ライブラリに保存します

次の例は、Python Excel ライブラリで HTML を DOCX に変換する方法を示しています。

HTML を DOCX に変換するには、簡単な手順に従ってください。HTML ファイルをアップロードし、DOCX ファイルとして保存するだけです。HTML の読み取りと DOCX の書き込みの両方で、完全修飾ファイル名を使用できます。出力される DOCX の内容とフォーマットは、元の HTML ドキュメントと同一になります。

Python Excel ライブラリを使用して HTML を DOCX に変換するサンプル コード
Input file
Select format
   
                                   

	
  import  aspose.cells 
  from aspose.cells import Workbook
  workbook = Workbook("Input.xlsx")
  workbook.save("Output.pdf")
	 
                
            

HTML を DOCX に変換する方法

プログラムで HTML ファイルを DOCX に変換する必要がありますか? Python 開発者は、わずか数行のコードで HTML を簡単にロードして DOCX に変換できます。

  1. 「Aspose.Cells for Python via .NET」をインストールします。
  2. Python プロジェクトにライブラリ参照を追加します (ライブラリをインポートします)。
  3. ワークブックのインスタンスを使用して HTML ファイルを読み込みます。
  4. Workbook.save メソッドを呼び出して、HTML を DOCX に変換します。
  5. HTML から DOCX への変換結果を取得します。

Python を HTML に変換する Excel ライブラリ

Python パッケージは PyPi リポジトリでホストされています。

Aspose.Cells for Pythonをインストールpypi次のようにコマンドを使用します:$ pip install aspose-cells-python.

また、 ステップバイステップの手順 開発環境に「Aspose.Cells for Python via .NET」をインストールする方法について説明します。

システム要求

Aspose.Cells for Python 経由 NET はプラットフォームに依存しません API あらゆるプラットフォームで使用できます (Windows、Linux)。システムが Python 3.7以上。

HTML HTML ファイル形式とは

HTML (ハイパーテキスト マークアップ言語) は、ブラウザーで表示するために作成された Web ページの拡張機能です。Web の言語として知られる HTML は、Web ページの一部として表示される新しい情報の要件に合わせて進化してきました。最新のバリアントは HTML 5 と呼ばれ、この言語の操作に多くの柔軟性をもたらします。HTML ページは、これらがホストされているサーバーから受信されるか、ローカル システムから読み込むこともできます。各 HTML ページは、フォーム、テキスト、画像、アニメーション、リンクなどの HTML 要素で構成されています。これらの要素は、タグと、各タグに開始と終了があるその他のいくつかの要素によって表されます。また、JavaScript やスタイル シート (CSS) などのスクリプト言語で記述されたアプリケーションを埋め込んで、全体的なレイアウトを表現することもできます。

続きを読む

DOCX DOCX ファイル形式とは

DOCX は、Microsoft Word 文書のよく知られた形式です。2007 年に Office 2007 のリリースで導入されたこの新しい文書形式の構造は、プレーン バイナリから XML とバイナリ ファイルの組み合わせに変更されました。Docx ファイルは、Word 2007 以降のバージョンで開くことができますが、DOC ファイル拡張子をサポートする以前のバージョンの MS Word では開くことができません。

続きを読む

サポートされているその他の変換

HTML を、以下にリストされているものを含む他の多くのファイル形式に変換することもできます。

HTML から BMP (ビットマップ画像)
HTML から EMF (拡張メタファイル形式)
HTML から GIF (グラフィカル交換フォーマット)
HTML MD宛 (マークダウン言語)
HTML から MHTML (ウェブページアーカイブ形式)
HTML から ODS (OpenDocument スプレッドシート ファイル)
HTML から PDF (ポータブルドキュメントフォーマット)
HTML から PNG (ポータブルネットワークグラフィックス)
HTML から SVG (スケーラブルベクターグラフィックス)
HTML から TIFF (タグ付き画像フォーマット)
HTML から TSV (タブ区切り値)
HTML から TXT (テキスト文書)
HTML から XLS (Excel バイナリ形式)
HTML から XLSB (バイナリ Excel ワークブック ファイル)
HTML から XLSM (スプレッドシートファイル)
HTML から XLSX (OOXML Excel ファイル)
HTML から XLT (Microsoft Excel テンプレート)
HTML から XLTM (Excel マクロ対応テンプレート)
HTML から XLTX (Office OpenXML Excel テンプレート)
HTML XMLへ (拡張マークアップ言語)
HTML から XPS (XML ペーパー仕様)
HTML から JSON (JavaScript オブジェクト表記)