HTMLをPythonの部分に分割します

与えられた基準に従って1つのHTMLファイルをより小さなファイルのグループに分割する高速Pythonライブラリ。

Python via .NETライブラリを使用して、HTMLファイルをパーツに分割します。抽出したHTMLページを他のデータと統合し、その結果、必要なフォームとコンテンツのドキュメントを取得できます。 HTMLをパーツに分割すると、HTMLファイルでの共同作業が容易になります。

コード スニペットを表示

HTML を使用して Python を分割します

このソフトウェアライブラリは、 Python 開発者に、ファイル HTML をパーツに分割するための一連の関数を提供します。 HTML を個別のファイルに分割すると、ドキュメントのセクションを並行して操作しやすくなります。たとえば、複数の人が同時に1つの HTML で作業している場合、 HTML を分割すると、作業をスピードアップできます。分割 HTML は、ファイル HTML からテキストを抽出し、データを自動化された情報システムまたはデータベースに統合するためのテクノロジーの一部である可能性があります。

私たちのライブラリは、 Python 開発者に、 HTML をパーツに分割し、指定されたモードに従ってページを抽出するために必要なすべての関数を提供します。これはスタンドアロンの Python via .NET ソリューションであり、Microsoft Word、Acrobat Reader、またはその他のアプリケーションをインストールする必要はありません。

ファイル HTML をコード Python の部分に分割します

Python コードで異なる基準を使用して、 HTML コンテンツを分割します。 HTML ファイルには、次のページ抽出モードを使用できます。「見出しで分割」、「セクションで分割」、「ページで分割」、「ページ範囲で分割」。

ファイル HTML をパーツに分割した後、 'Document.Save' メソッドを使用して結果を必要なファイル形式にエクスポートできます。 'DocumentPartSavingCallback' プロパティを使用して、 HTML パーツをHTMLまたはEPUBにエクスポートする方法を制御することもできます。これにより、出力ストリームをリダイレクトできます。

Python via .NET のソリューションを使用して、ドキュメント HTML を簡単に分割します。次の例は、 HTML を使用して Python:

HTML ファイルを分割するための Python コード例
分割したいファイルをアップロードする
コードを実行する
リストからターゲットフォーマットを選択します
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
コードを実行する

HTMLをPythonで分割する方法

  1. Pythonライブラリをインストールして、プログラムでHTMLファイルを分割します。
  2. Pythonプロジェクトにライブラリ参照を追加(ライブラリをインポート)します。
  3. PythonでHTMLを開きます。
  4. extract_pages()メソッドを呼び出して、HTMLから特定のページを抽出します。
  5. HTML分割の結果を個別のファイルとして取得します。

HTML 個のドキュメントを分割するための Python ライブラリ

Python パッケージはPyPiリポジトリでホストしています。 "Aspose.Words for Python via .NET" 開発者環境にインストールする方法のステップバイステップの説明に従ってください。

システム要求

このパッケージは Python ≥3.5 および <3.12 と互換性があります。 Linux 用のソフトウェアを開発する場合は、 製品ドキュメントの gcc および libpython の追加要件を参照してください。

その他のサポートされているHTML分割操作

HTMLを他のファイル形式に分割することもできます。

5%

Aspose製品アップデートを購読する

メールボックスに直接配信される月刊ニュースレターとオファーを入手してください。

© Aspose Pty Ltd 2001-2024. 全著作権所有。