Aspose.HTML for Python via .NET是一种用于 HTML 处理的高级 API,允许在跨平台应用程序中执行广泛的管理和操作任务。该 API 可以创建、修改、提取数据、转换和呈现 HTML 文档,而无需外部软件。它支持流行的文件格式,如 EPUB、MHTML、XML、SVG 和 Markdown,并可以渲染为 PDF、DOCX、XPS 和图像文件格式。 Aspose.HTML for Python via .NET 可用于构建 32 位或 64 位 Python 应用程序。此外,HTML 文档对象模型与 CSS、HTML Canvas、SVG、XPath 和 JavaScript 等嵌入式格式和规范集成,开箱即用,扩展了操作功能和渲染质量。通过 使用Aspose.HTML for Python via .NET API在Python中开发高级、独立于平台的软件! 在 Python 中开发高级、平台无关的软件!

高级 Python API 功能

从头开始创建 HTML

从文件、流或 URL 加载 HTML

添加、替换或删除节点

从 HTML 文档中提取数据

加载 EPUB 和 MHTML 文件格式

将 HTML 转换为其他文件格式

一次渲染多个文档

实现 Markdown 到 HTML 转换器

在 HTML 到 PDF 转换期间应用页眉和页脚

使用 XPath 查询或 CSS 选择器导航 HTML

从网络中提取数据

合并 HTML、MHTML、EPUB 和 MD 文件

文档中的 Python API 功能

Aspose.HTML for Python via .NET 是一个用于处理现实世界 HTML 的类库。您可以在我们的文档中查看 Aspose.HTML 功能的完整列表。通过在项目中使用 Python Aspose.HTML 库,您可以使用基于 HTML 的文档执行各种任务。

在 Python 中转换 HTML

Aspose.HTML for Python via .NET API 是使用 Python 解析和处理 HTML 文档的强大解决方案。只需几行代码,您就可以轻松地将 HTML、MHTML、EPUB、Markdown 和 SVG 转换为 Python 应用程序中的其他流行格式。转换过程简单可靠,使 Aspose.HTML for Python via .NET API 成为满足您需求的绝佳选择。


将 HTML 转换为 PDF – Python 代码示例



from aspose.html import *
from aspose.html.converters import *
from aspose.html.saving import *

# Load an HTML document to be converted
document = HTMLDocument("document.html")

# Create an instance of the PdfSaveOptions class
options = PdfSaveOptions()

# Convert HTML to PDF
Converter.convert_html(document, options, "output.pdf")




Aspose.HTML 提供免费的在线转换器 用于将基于 HTML 的文档转换为 PDF、XPS、DOCX、JPG、PNG、BMP、TIFF、GIF 和其他格式。

浏览 HTML

Aspose.HTML for Python via .NET 提供了一个全面的 API,用于在 Python 应用程序中有效地导航和操作 HTML 文档。它允许您无缝解析和遍历 HTML 内容,提供 HTML 元素的详细检查和编辑。


导航 HTML – Python 代码示例



from aspose.html import *

# Prepare HTML code
html_code = "<span>Hello</span> <span>World!</span>"

# Initialize a document from the prepared code
with HTMLDocument(html_code, ".") as document:
    # Get the reference to the first child (first <span>) of the body
    element = document.body.first_child
    print(element.text_content)  # output: Hello

    # Get the reference to the whitespace between html elements
    element = element.next_sibling
    print(element.text_content)  # output: ' '

    # Get the reference to the second <span> element
    element = element.next_sibling
    print(element.text_content)  # output: World!



数据提取

Aspose.HTML for Python via .NET 完全基于 W3C 规范,支持 XPath 和 CSS 选择器查询。有了它,您可以快速检查任何 HTML 文档的内容并创建您自己的数据提取解决方案。


数据提取 – Python 代码示例



from aspose.html import *

# Create an instance of HTML document with a web address
document = html.HTMLDocument("https://www.wikipedia.org/")

# Query all h2 elements
elements = document.query_selector_all("h2")

# Check if any h2 elements are found
if elements.length > 0:
    # Get the first h2 element
    first_heading = elements[0]
    # Get the text content of the h2 element
    content = first_heading.text_content.strip() if first_heading.text_content else ""
    # Print the text of the first h2 element
    print("Text of the first heading:")
    print(content)
else:
    print("No h2 elements found on the page")



Aspose.HTML for Python via .NET 使 HTML 文档的导航和操作变得简单而高效,为需要以编程方式处理 HTML 内容的开发人员提供了多功能解决方案。



  

Support and Learning Resources

  
  

Aspose.HTML 为其他流行的开发环境提供单独的 HTML 处理 API,如下所列: