在 Python 中转换 HTML
Python 库为您的所有 HTML 转换任务提供无缝解决方案。将 HTML 转换为 PDF、MHTML、Markdown、XPS、DOCX 和图像!
如何使用 Python 转换 HTML
Aspose.HTML for Python via .NET API API 是使用 Python 解析和处理 HTML 文档的强大解决方案。 HTML 是互联网的支柱,是在网站上呈现信息的主要语言。有时,您需要将 HTML 转换为各种格式,例如 PDF、XPS、DOCX、Markdown、MHTML 和图像,以便将它们用于特定任务。 Aspose.HTML for Python via .NET API 使开发人员的转换过程更加容易。它使用 HTMLDocument 类加载文件,创建相关的保存选项对象并使用 Converter class 相关的转换方法。
Python API 简化了此转换过程,通过三个基本步骤为开发人员提供了简化的方法:
- 使用 HTMLDocument 类将 HTML 文档加载到 Document 对象中。您可以从文件、HTML 代码或 URL 加载 HTML。
- 根据目标格式(例如 PDF、XPS、DOCX、MHTML、Markdown、图像),创建相应的 SaveOptions 对象。该对象允许您指定与输出格式相关的各种参数,例如质量、页面设置、图像格式等。 aspose.html.saving 命名空间由数据类呈现,用于描述特定的保存选项转换和保存过程。
- 调用 convert_html() 方法之一并向其传递所需的参数。
使用强大的 Python API 处理 HTML 内容并将其转换为您的应用程序需要的格式!
在线 HTML 转换器
您可以使用 Aspose.HTML 实时转换 HTML。以下 Python 代码示例演示了如何转换 HTML 文档。请从本地文件系统或 URL 加载文件,选择输出格式并运行示例。您将立即得到结果。另外,您还可以免费在线尝试转换器在这里。
from aspose.html import * from aspose.html.converters import * from aspose.html.saving import * # Load an HTML document from a file or URL document = HTMLDocument("{{input lower}}") # Initialize saving options {{#if_output 'PDF'}} options = PdfSaveOptions() {{/if_output}} {{#if_output 'DOCX'}} options = DocSaveOptions() {{/if_output}} {{#if_output 'XPS'}} options = XpsSaveOptions() {{/if_output}} {{#if_output 'BMP' 'JPEG' 'GIF' 'PNG' 'TIFF'}} options = ImageSaveOptions(ImageFormat.{{output param2 upper}}) {{/if_output}} {{#if_output 'MHTML'}} options = MHTMLSaveOptions() {{/if_output}} {{#if_output 'MD'}} options = MarkdownSaveOptions() {{/if_output}} {{#if_output 'BMP' 'JPEG' 'GIF' 'PNG' 'TIFF' 'PDF' 'MHTML' 'MD' 'XPS' 'DOCX'}} # Convert HTML to {{output upper}} Converter.convert_html(document, options, "output.{{output lower}}") {{/if_output}} {{#if_output 'XHTML'}} options = HTMLSaveOptions() options.document_type = HTMLSaveOptions.XHTML # Save HTML as {{output upper}} document.save("output.xhtml", options) {{/if_output}}
转换 HTML、MHTML、EPUB、Markdown 和 SVG
aspose.html.converters 命名空间提供了对转换方法的轻松访问。它提供了许多流行格式的转换,例如 PDF、XPS、图像格式等。使用 Converter 类,您可以轻松地将加载的 HTML 和其他基于 HTML 的文档转换为所需的格式:
- convert_html() 方法使用指定的 SaveOptions 将 HTML 内容转换为 PDF、XPS、DOCX、MHTML、Markdown 或图像,以确保格式的准确性和完整性。
- convert_markdown() 方法将 Markdown 内容转换为 HTML。所有这些方法都允许基本的 Markdown 到 HTML 的转换。从 Markdown 到其他格式的转换要经过 Markdown 到 HTML 转换阶段。
- convert_mhtml() 方法将 MHTML 内容转换为 PDF、XPS、DOCX 和图像。
- convert_epub() 方法将 EPUB 内容转换为 PDF、XPS、DOCX 和图像。
- convert_svg() 方法将 SVG 内容转换为 PDF、XPS 和图像。
要了解有关使用 Python API 转换函数的 Aspose.HTML for Python 的更多信息,请访问我们的 文档 。
安装 Aspose.HTML Python 库
该库支持解析 HTML5、CSS3、SVG 和 HTML Canvas,以构建基于 WHATWG DOM 标准的文档对象模型 (DOM)。您可以執行以下命令在系統上安裝 Aspose.HTML for Python via .NET:
pip install aspose-html-net
有关Python库安装和系统要求的更多详细信息,请参阅 Aspose.HTML文档 。
其他支持的转换
您还可以将 HTML、XHTML、MHTML、EPUB、Markdown 和 SVG 文件转换为许多其他文件格式,包括下面列出的几种: