Python経由でHTMLをDOCXに変換

HTML から DOCX へのPython変換。プログラマーはこのサンプルコードを使用して、COM Interop を介して任意の.NET Framework、.NET Core、および PHP、VBScript、Delphi、C++ 内の DOCX を DOCX にエクスポートできます。

Python for .NET の HTML を DOCX に変換

HTML を DOCX に変換するにはどうすればいいですか?最新のドキュメント処理 Python API を使用すると、ドキュメントを HTML 形式から DOCX 形式にプログラム的に簡単に変換できます。わずか数行のコードで高品質のファイルを変換できます。Aspose.PDF ライブラリを使用すると、Python を使用して HTML を DOCX に変換するタスクをどの開発者も簡単に解決できます。

コードスニペットやその他の可能な変換形式の詳細については、ドキュメント ページを参照してください。また、ライブラリでサポートされている他の 変換 形式の確認もできます。

Aspose.PDF for .NET ライブラリを使用すると、HTML をプログラムで DOCX に変換できます。AsposeのPDFソフトウェアは、個人、中小企業、大企業に最適です。大量の情報を処理できるため、変換を迅速かつ効率的に実行し、データを保護します。Aspose.PDF 特有の機能として、HTML を DOCX に変換する API があります。この方法の特徴は、NuGet パッケージマネージャーを開いて「Aspose.pdf for .NET」を検索し、特別な複雑な設定なしでインストールするだけでよいことです。(インストールにはパッケージマネージャーコンソールのコマンドを使用してください)。ライブラリの利点を確認するには、HTML から DOCX への変換コードスニペットを使用してみてください。パッケージマネージャーコンソールから次のコマンドを使用することもできます。

Python Package Manager Console

pip install aspose-pdf

HTML を DOCX に変換する方法


Python for .NET 開発者は、わずか数行のコードで HTML ファイルを DOCX に簡単にロードして変換できます。

  1. 新しいドキュメントを初期化する
  2. 出力ファイルパスと SaveFormat.Docx をパラメータとして渡しながら、Document.Save メソッドを呼び出します
  3. DOCXファイルは指定されたパスに保存されます

Python で HTML を DOCX に変換する方法を示す例を次に示します。HTML ファイルを DOCX 形式に変換するには、以下の簡単な手順に従ってください。まず HTML ファイルをアップロードしてから、DOCX ファイルとして保存します。HTML の読み取りと DOCX の書き込みの両方に完全修飾ファイル名を使用できます。出力される DOCX の内容とフォーマットは、元の HTML ドキュメントと同じになります。

例:Python を使用して HTML を DOCX に変換します

このサンプルコードは HTML から DOCX Python への変換を示しています

Input file:

File not added

Output format:

DOCX

Output file:

    def convert_HTML_to_DOCX(self, infile, outfile):

        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        options = HtmlLoadOptions()
        document = Document(path_infile, options)

        save_option = DocSaveOptions()
        save_option.Format = DocSaveOptions.DocFormat.DocX

        # Save the file into MS Word document format

        document.Save(path_outfile, save_option)
        print(infile + " converted into " + outfile) 

Python for .NET ライブラリを使用して HTML を DOCX に変換する

.NET API 経由の Python 用 Aspose.PDF は、確立されている PDF 標準と PDF 仕様のほとんどをサポートしています。開発者は表、グラフ、画像、ハイパーリンク、カスタムフォントなどを PDF ドキュメントに挿入できます。さらに、PDF 文書を圧縮することもできます。.NET 経由の Python 用 Aspose.PDF は、安全な PDF 文書を開発するための優れたセキュリティ機能を備えています。.NET API 経由の Aspose.PDF for Python の主な機能には次のものがあります。

  • BMP、GIF、JPEG、PNG を含む複数のイメージフォーマットで PDF を読み取ったりエクスポートしたりすることができます。
  • PDF ドキュメントの基本情報 (作成者、作成者など) を設定します。
  • 変換機能:PDF をワード、エクセル、パワーポイントに変換します。PDF を画像形式に変換します。PDF ファイルを HTML 形式に、またはその逆に変換します。PDF を EPUB、テキスト、XPS などに変換します。

.NET API 経由の Aspose.PDF for Python の詳細については、API の使用方法に関する当社の ドキュメント を参照してください。