Aspose.HTML for .NET – это расширенный API-интерфейс обработки HTML для выполнения широкого спектра задач управления и манипулирования в кросс-платформенных приложениях. API предназначен для создания, изменения, извлечения данных, преобразования и рендеринга HTML-документов без какого-либо внешнего программного обеспечения. Кроме того, он поддерживает популярные форматы файлов, такие как EPUB, MHTML, XML, SVG и Markdown, а также рендеринг в форматы файлов PDF, DOCX, XPS и изображений. Aspose.HTML for .NET полностью написан на C# и может использоваться для создания любого типа 32-разрядного или 64-разрядного приложения .NET, включая ASP.NET, WCF, WinForms и .NET Core. Кроме того, объектная модель HTML-документа интегрирована со встроенными форматами и спецификациями, такими как CSS, HTML Canvas, SVG, XPath и JavaScript, которые расширяют возможности манипулирования и качество рендеринга.

Расширенные функции .NET HTML API

Функции API в документации

Вы можете увидеть полный список функций Aspose.HTML в нашей документации. Использование библиотеки C# Aspose.HTML в вашем проекте позволяет выполнять следующие задачи:

Конвертация HTML в другие форматы на C#

C# API позволяет всего несколькими строками кода реализовать преобразование HTML в PDF, HTML в изображение, HTML в XHTML и т.д. Процесс преобразования прост и надежен, что делает Aspose.HTML for .NET API идеальным выбором.

Преобразование HTML в PDF – С#



using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...

    // Load an HTML file to be converted
    using var document = new HTMLDocument("input.html")

    // Create an instance of the PdfSaveOptions class
    var pdfSaveOptions = new PdfSaveOptions();

    // Convert HTML to PDF
    Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");


Вы можете проверить в работе онлайн Конвертер HTML перейдя по ссылке.

Вы также можете конвертировать HTML, XHTML, MHTML, Markdown, EPUB или SVG во многие другие форматы файлов, включая некоторые из перечисленных ниже:

Объединение HTML, MHTML, EPUB и MD файлов

Aspose.HTML for .NET API упрощает процесс объединения файлов для разработчиков: файлы загружаются с помощью класса HTMLDocument; создается экземпляр Renderer и необходимое устройство вывода; используется метод Render() для объединения всех документов HTML, EPUB, MD или MHTML.
Вы можете объединять HTML, MHTML, Markdown, и EPUB документы в файлы форматов PDF, XPS, DOCX, TIFF и др.:

Редактирование HTML-документов

Aspose.HTML for .NET позволяет создавать и редактировать HTML-документы с использованием объектной модели документа (DOM). DOM – это программный интерфейс для HTML-документов, который представляет документ (в виде узлов и объектов) в виде дерева узлов, где каждый узел представляет часть документа. Aspose.HTML for .NET API позволяет вам подключаться к странице и изменять структуру, стиль и содержимое документа. Вы можете изменить документ, вставив новые узлы и удалив или отредактировав содержимое существующих узлов.

.NET HTML API помогает разработчикам читать, изменять, перемещаться и редактировать документы (X)HTML. Некоторые функции редактирования файлов, которые может выполнять Aspose.HTML for .NET API, следующие:

  • перемещаться по документам HTML с помощью различных методов, таких как обход элементов, обход документа, запросы XPath и запросы селектора CSS,
  • удалить и заменить узлы HTML,
  • извлекать и редактировать CSS из HTML,
  • настроить песочницу для документов и многое другое.

Вы можете легко редактировать документы, генерировать HTML-код и собирать данные из Интернета онлайн или программно, используя следующие инструменты:

Поддержка Markdown

Markdown – это язык разметки с синтаксисом форматирования простого текста. Markdown часто используется в качестве формата для документации и файлов readme, поскольку он позволяет писать в удобном для чтения и написания стиле. Aspose.HTML предоставляет мощный и гибкий конвертер Markdown, который может конвертировать в обоих направлениях из Markdown в HTML и из HTML в Markdown. Более того, API-интерфейс преобразователя имеет набор предопределенных правил, поэтому вы можете конвертировать HTML в Markdown, используя аутентичный синтаксис Markdown, модификацию GitLab Flavored Markdown или даже настраивать правила для своих нужд.

Преобразование HTML в Markdown – C#



using Aspose.Html;
using Aspose.HTML.Saving;
...

	// Load an HTML file
	using var document = new HTMLDocument("document.html");

	// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
	document.Save("output.md", MarkdownSaveOptions.Git);


Обратное преобразование так просто! Используя библиотеку классов Aspose.HTML в своем приложении C#, вы можете легко преобразовать Markdown в HTML-файл всего одной строкой кода!

Преобразование Markdown в HTML – C#



using Aspose.Html.Converters;
...

	// Convert Markdown to HTML
	Converter.ConvertMarkdown("document.md", "output.html");



Вы можете попробовать онлайн Конвертер Markdown. Конвертируйте Markdown в PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF и MHTML. Загружайте, преобразовывайте свои документы и получайте результаты за несколько секунд. Вам не нужно никакого дополнительного программного обеспечения.

Библиотека Aspose.HTML for .NET предоставляет API синтаксического анализа Markdown для платформы C#. Вы можете создавать, редактировать, сохранять, объединять, конвертировать файлы MD в файлы других форматов, а также добавлять ссылки, списки, блоки кода, изображения и другие элементы в файлы Markdown, следуя ссылкам:

Электронные книги и веб-архивы

Aspose.HTML for .NET может загружать файлы EPUB и MHTML для выполнения различных операций, включая преобразование в форматы с фиксированным макетом и растровые изображения.

Преобразование EPUB в PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	// Open an existing EPUB file for reading
     using var stream = File.OpenRead("input.epub");

     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();

     // Call the ConvertEPUB method to convert EPUB to PDF
     Converter.ConvertEPUB(stream, options, "output.pdf");


Преобразование MHTML в PDF – C#


     
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	// Open an existing MHTML file for reading
    using var stream = File.OpenRead("input.mht");

    // Create an instance of PdfSaveOptions
    var options = new PdfSaveOptions();

    // Call the ConvertMHTML method to convert MHTML to PDF
    Converter.ConvertMHTML(stream, options, output.pdf);



Вы можете попробовать онлайн Конвертер MHTML и онлайн Конвертер EPUB. Наши браузерные инструменты конвертации работают на всех платформах, включая Windows , Linux, Mac OS, Android и iOS. Конвертеры совместимы со всеми ПК, смартфонами и планшетами.

Веб-скрейпинг

Веб-скрапинг – извлечение веб-данных или веб-сканирование, представляет собой метод извлечения данных с веб-сайта. Aspose.HTML не поддерживает встроенный модуль Web Scraping. Однако, используя Aspose.HTML API, который полностью основан на спецификации W3C и поддерживает запросы XPath и CSS Selector, вы можете легко проверить содержимое любого HTML-документа и создать собственное решение для веб-скрейпинга.

Простое извлечение веб-данных – C#


     
using Aspose.Html;
...

    // Create an instance of the HTML document with a website as a parameter
    using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");

    // Get all anchor-elements
    var elements = document.QuerySelectorAll("a");

    // Dump the anchor-element data to the console
    elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
        {
            System.Console.WriteLine("[Href]: " + x.Href);
            System.Console.WriteLine("[Content]: " + x.TextContent);
        });



Aspose.HTML предлагает бесплатные онлайн-приложения Извлечение данных, способ получения данных с веб-сайтов. Наши приложения безопасны, работают на любой платформе и не требуют установки программного обеспечения. Парсеры данных можно использовать для извлечения изображений, получения ключевых слов с веб-страницы и т. д. Они просты и понятны в использовании, но при этом действенны и надежны.

Другие функции Aspose.HTML for .NET API

Используйте библиотеку C# Aspose.HTML для конвертации, объединения, редактирования HTML-документов, извлечения данных из Интернета и многого другого!



  
  

Aspose.HTML предлагает отдельные API-интерфейсы обработки HTML для других популярных сред разработки, перечисленных ниже: