API Python для обробки файлів HTML

Створюйте, редагуйте, витягуйте дані, об’єднуйте та конвертуйте сторінки HTML у PDF, DOCX, XPS, зображення та інші формати.

Aspose.HTML for Python via .NET – це розширений API для обробки HTML, який дозволяє виконувати широкий спектр завдань керування та маніпулювання в кросплатформних програмах. Python API може створювати, змінювати, витягувати дані, конвертувати та відтворювати HTML-документи без потреби у зовнішньому програмному забезпеченні. Він підтримує такі популярні формати файлів, як EPUB, MHTML, XML, SVG і Markdown, а також може відтворювати файли у форматах PDF, DOCX, XPS і Image. Aspose.HTML for Python via .NET можна використовувати для створення 32-розрядних або 64-розрядних програм Python. Крім того, об’єктна модель HTML-документа інтегрована із вбудованими форматами та специфікаціями, такими як CSS, HTML Canvas, SVG, XPath і JavaScript, що розширює функціональність маніпуляції та якість візуалізації. Використовуйте Aspose.HTML for Python via .NET API для розробки програмного забезпечення високого рівня, незалежного від платформи на Python!

Розширені функції Python API

new Об’єднати файли HTML, MHTML, EPUB і MD

new Створити HTML-код

new Як змінити колір тексту в HTML

new Як додати колір у HTML

Вилучити зображення з веб-сторінки

Вилучити SVG з веб-сайту

Зберегти файл з URL-адреси

Завантажити таблицю з вебсайту

Широкий діапазон перетворень між форматами

Конвертувати HTML в інші формати файлів

Конвертер Markdown в HTML

Створити HTML з нуля

Завантажити HTML із файлу, потоку чи URL-адреси

Додати, замінити або видалити вузли

Завантажити формати файлів EPUB і MHTML

Виводити кілька документів одночасно

Навігація HTML за допомогою XPath Query або CSS Selector

Видобуток даних з Інтернету

Конвертувати HTML у PDF

Функції API Python у документації

Aspose.HTML for Python via .NET – це бібліотека класів для роботи з реальним HTML. Ви можете переглянути повний список функцій Aspose.HTML у нашій документації. Використання бібліотеки Python Aspose.HTML у вашому проекті дозволяє виконувати широкий спектр завдань із документами на основі HTML.

Конвертувати HTML на Python

Aspose.HTML for Python via .NET API – це потужне рішення для аналізу та обробки документів HTML за допомогою Python. За допомогою лише кількох рядків коду ви можете легко конвертувати HTML, MHTML, EPUB, Markdown і SVG в інші популярні формати у своїх програмах Python. Процес перетворення простий і надійний, що робить Aspose.HTML for Python via .NET API чудовим вибором для ваших потреб.

Конвертувати HTML у PDF – приклад коду Python



from aspose.html import *
from aspose.html.converters import *
from aspose.html.saving import *

# Load an HTML document to be converted
document = HTMLDocument("document.html")

# Create an instance of the PdfSaveOptions class
options = PdfSaveOptions()

# Convert HTML to PDF
Converter.convert_html(document, options, "output.pdf")

Aspose.HTML надає безкоштовні онлайн Конвертери для перетворення документів на основі HTML у формати PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF та інші.

Ви також можете конвертувати HTML, XHTML, MHTML, Markdown, EPUB або SVG у багато інших форматів файлів, зокрема перелічені нижче:

Навігація HTML документом

Aspose.HTML for Python via .NET надає комплексний API для ефективної навігації та роботи з документами HTML у ваших програмах Python. Це дозволяє легко аналізувати та переглядати вміст HTML, забезпечуючи детальну перевірку та редагування елементів HTML.

Навігація HTML – приклад коду Python



from aspose.html import *

# Prepare HTML code
html_code = "<span>Hello</span> <span>World!</span>"

# Initialize a document from the prepared code
with HTMLDocument(html_code, ".") as document:
    # Get the reference to the first child (first <span>) of the body
    element = document.body.first_child
    print(element.text_content)  # output: Hello

    # Get the reference to the whitespace between html elements
    element = element.next_sibling
    print(element.text_content)  # output: ' '

    # Get the reference to the second <span> element
    element = element.next_sibling
    print(element.text_content)  # output: World!

Вилучення даних

Aspose.HTML for Python via .NET повністю базується на специфікації W3C і підтримує запити XPath і CSS Selector. З його допомогою ви можете швидко перевірити вміст будь-якого документа HTML і створити власне рішення для вилучення даних.

Витяг даних з HTML – приклад коду Python



from aspose.html import *

# Create an instance of HTML document with a web address
document = html.HTMLDocument("https://www.wikipedia.org/")

# Query all h2 elements
elements = document.query_selector_all("h2")

# Check if any h2 elements are found
if elements.length > 0:
    # Get the first h2 element
    first_heading = elements[0]
    # Get the text content of the h2 element
    content = first_heading.text_content.strip() if first_heading.text_content else ""
    # Print the text of the first h2 element
    print("Text of the first heading:")
    print(content)
else:
    print("No h2 elements found on the page")

Aspose.HTML for Python via .NET робить навігацію та маніпулювання HTML-документами ефективним та простим, забезпечуючи універсальне рішення для розробників, яким потрібно працювати з HTML-контентом програмно. Якщо ви хочете автоматично перевіряти, захоплювати та витягувати дані з веб-сторінок за допомогою Python API, будь ласка, зверніться до статей: