Aspose.HTML for Python via .NET是一种用于 HTML 处理的高级 API,允许在跨平台应用程序中执行广泛的管理和操作任务。该 API 可以创建、修改、提取数据、转换和呈现 HTML 文档,而无需外部软件。它支持流行的文件格式,如 EPUB、MHTML、XML、SVG 和 Markdown,并可以渲染为 PDF、DOCX、XPS 和图像文件格式。 Aspose.HTML for Python via .NET 可用于构建 32 位或 64 位 Python 应用程序。此外,HTML 文档对象模型与 CSS、HTML Canvas、SVG、XPath 和 JavaScript 等嵌入式格式和规范集成,开箱即用,扩展了操作功能和渲染质量。通过 使用Aspose.HTML for Python via .NET API在Python中开发高级、独立于平台的软件! 在 Python 中开发高级、平台无关的软件!
高级 Python API 功能
new 多种格式之间的转换
从头开始创建 HTML
从文件、流或 URL 加载 HTML
添加、替换或删除节点
从 HTML 文档中提取数据
加载 EPUB 和 MHTML 文件格式
将 HTML 转换为其他文件格式
一次渲染多个文档
实现 Markdown 到 HTML 转换器
在 HTML 到 PDF 转换期间应用页眉和页脚
使用 XPath 查询或 CSS 选择器导航 HTML
从网络中提取数据
合并 HTML、MHTML、EPUB 和 MD 文件
文档中的 Python API 功能
Aspose.HTML for Python via .NET 是一个用于处理现实世界 HTML 的类库。您可以在我们的文档中查看 Aspose.HTML 功能的完整列表。通过在项目中使用 Python Aspose.HTML 库,您可以使用基于 HTML 的文档执行各种任务。
在 Python 中转换 HTML
Aspose.HTML for Python via .NET API 是使用 Python 解析和处理 HTML 文档的强大解决方案。只需几行代码,您就可以轻松地将 HTML、MHTML、EPUB、Markdown 和 SVG 转换为 Python 应用程序中的其他流行格式。转换过程简单可靠,使 Aspose.HTML for Python via .NET API 成为满足您需求的绝佳选择。
将 HTML 转换为 PDF – Python 代码示例
from aspose.html import *
from aspose.html.converters import *
from aspose.html.saving import *
# Load an HTML document to be converted
document = HTMLDocument("document.html")
# Create an instance of the PdfSaveOptions class
options = PdfSaveOptions()
# Convert HTML to PDF
Converter.convert_html(document, options, "output.pdf")
Aspose.HTML 提供免费的在线转换器 用于将基于 HTML 的文档转换为 PDF、XPS、DOCX、JPG、PNG、BMP、TIFF、GIF 和其他格式。
浏览 HTML
Aspose.HTML for Python via .NET 提供了一个全面的 API,用于在 Python 应用程序中有效地导航和操作 HTML 文档。它允许您无缝解析和遍历 HTML 内容,提供 HTML 元素的详细检查和编辑。
导航 HTML – Python 代码示例
from aspose.html import *
# Prepare HTML code
html_code = "<span>Hello</span> <span>World!</span>"
# Initialize a document from the prepared code
with HTMLDocument(html_code, ".") as document:
# Get the reference to the first child (first <span>) of the body
element = document.body.first_child
print(element.text_content) # output: Hello
# Get the reference to the whitespace between html elements
element = element.next_sibling
print(element.text_content) # output: ' '
# Get the reference to the second <span> element
element = element.next_sibling
print(element.text_content) # output: World!
数据提取
Aspose.HTML for Python via .NET 完全基于 W3C 规范,支持 XPath 和 CSS 选择器查询。有了它,您可以快速检查任何 HTML 文档的内容并创建您自己的数据提取解决方案。
数据提取 – Python 代码示例
from aspose.html import *
# Create an instance of HTML document with a web address
document = html.HTMLDocument("https://www.wikipedia.org/")
# Query all h2 elements
elements = document.query_selector_all("h2")
# Check if any h2 elements are found
if elements.length > 0:
# Get the first h2 element
first_heading = elements[0]
# Get the text content of the h2 element
content = first_heading.text_content.strip() if first_heading.text_content else ""
# Print the text of the first h2 element
print("Text of the first heading:")
print(content)
else:
print("No h2 elements found on the page")
Aspose.HTML for Python via .NET 使 HTML 文档的导航和操作变得简单而高效,为需要以编程方式处理 HTML 内容的开发人员提供了多功能解决方案。