Aspose.HTML для .NET — это расширенный API-интерфейс обработки HTML для выполнения широкого спектра задач управления и манипулирования в кросс-платформенных приложениях. API предназначен для создания, изменения, извлечения данных, преобразования и рендеринга HTML-документов без какого-либо внешнего программного обеспечения. Кроме того, он поддерживает популярные форматы файлов, такие как EPUB, MHTML, XML, SVG и Markdown, а также рендеринг в форматы файлов PDF, DOCX, XPS и изображений. Aspose.HTML для .NET полностью написан на C# и может использоваться для создания любого типа 32-разрядного или 64-разрядного приложения .NET, включая ASP.NET, WCF, WinForms и .NET Core. Кроме того, объектная модель HTML-документа интегрирована со встроенными форматами и спецификациями, такими как CSS, HTML Canvas, SVG, XPath и JavaScript, которые расширяют возможности манипулирования и качество рендеринга.

Расширенные функции .NET HTML API

Создание HTML-страниц с нуля

Загрузить существующий HTML из файла, потока или URL

Реализовать спецификации W3C

Внедрение шаблонов с помощью слияния шаблонов

Заполните шаблон различными источниками данных

Рендеринг HTML Canvas 2D в PDF

Загрузка форматов файлов EPUB и MHTML

Отображение нескольких документов одновременно

Применение верхнего и нижнего колонтитула во время преобразования HTML в PDF

Навигация по HTML с помощью XPath Query или CSS Selector

Функции API в документации

Вы можете увидеть полный список функций Aspose.HTML в нашей документации. Использование библиотеки C# Aspose.HTML в вашем проекте позволяет выполнять следующие задачи:

Конвертация HTML в другие форматы на C#

C# API позволяет всего несколькими строками кода реализовать преобразование HTML в PDF, HTML в изображение, HTML в XHTML и т.д. Процесс преобразования прост и надежен, что делает Aspose.HTML для .NET API идеальным выбором.

Преобразование HTML в PDF — С#


     
using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...
    
    // Load an HTML file to be converted
    using var document = new HTMLDocument("input.html")
    
    // Create an instance of the PdfSaveOptions class
    var pdfSaveOptions = new PdfSaveOptions();    
    
    // Convert HTML to PDF
    Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");
    


Вы можете проверить в работе онлайн Конвертер HTML перейдя по ссылке.

Вы также можете конвертировать HTML, XHTML, MHTML, Markdown, EPUB или SVG во многие другие форматы файлов, включая некоторые из перечисленных ниже:

Объединение HTML, MHTML, EPUB и MD файлов

Aspose.HTML for .NET API упрощает процесс объединения файлов для разработчиков: файлы загружаются с помощью класса HTMLDocument; создается экземпляр Renderer и необходимое устройство вывода; используется метод Render() для объединения всех документов HTML, EPUB, MD или MHTML.
Вы можете объединять HTML, MHTML, Markdown, и EPUB документы в файлы форматов PDF, XPS, DOCX, TIFF и др.:

Редактирование HTML-документов

Aspose.HTML для .NET позволяет создавать и редактировать HTML-документы с использованием объектной модели документа (DOM). DOM — это программный интерфейс для HTML-документов, который представляет документ (в виде узлов и объектов) в виде дерева узлов, где каждый узел представляет часть документа. Aspose.HTML для .NET API позволяет вам подключаться к странице и изменять структуру, стиль и содержимое документа. Вы можете изменить документ, вставив новые узлы и удалив или отредактировав содержимое существующих узлов.

.NET HTML API помогает разработчикам читать, изменять, перемещаться и редактировать документы (X)HTML. Некоторые функции редактирования файлов, которые может выполнять Aspose.HTML для .NET API, следующие:

- перемещаться по документам HTML с помощью различных методов, таких как обход элементов, обход документа, запросы XPath и запросы селектора CSS,
- удалить и заменить узлы HTML,
- извлекать и редактировать CSS из HTML,
- настроить песочницу для документов и многое другое.

Вы можете легко редактировать документы, генерировать HTML-код и собирать данные из Интернета онлайн или программно, используя следующие инструменты:

Поддержка Markdown

Markdown — это язык разметки с синтаксисом форматирования простого текста. Markdown часто используется в качестве формата для документации и файлов readme, поскольку он позволяет писать в удобном для чтения и написания стиле. Aspose.HTML предоставляет мощный и гибкий конвертер Markdown, который может конвертировать в обоих направлениях из Markdown в HTML и из HTML в Markdown. Более того, API-интерфейс преобразователя имеет набор предопределенных правил, поэтому вы можете конвертировать HTML в Markdown, используя аутентичный синтаксис Markdown, модификацию GitLab Flavored Markdown или даже настраивать правила для своих нужд.

Преобразование HTML в Markdown — C#


     
using Aspose.Html;
using Aspose.HTML.Saving;
...
    
	// Load an HTML file
	using var document = new HTMLDocument("document.html");

	// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
	document.Save("output.md", MarkdownSaveOptions.Git);


Обратное преобразование так просто! Используя библиотеку классов Aspose.HTML в своем приложении C#, вы можете легко преобразовать Markdown в HTML-файл всего одной строкой кода!

Преобразование Markdown в HTML — C#


     
using Aspose.Html.Converters;
...	

	// Convert Markdown to HTML
	Converter.ConvertMarkdown("document.md", "output.html");



Вы можете попробовать онлайн Конвертер Markdown. Конвертируйте Markdown в PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF и MHTML. Загружайте, преобразовывайте свои документы и получайте результаты за несколько секунд. Вам не нужно никакого дополнительного программного обеспечения.

Электронные книги и веб-архивы

Aspose.HTML для .NET может загружать файлы EPUB и MHTML для выполнения различных операций, включая преобразование в форматы с фиксированным макетом и растровые изображения.

Преобразование EPUB в PDF — C#


     
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...
    
	// Open an existing EPUB file for reading
     using var stream = File.OpenRead("input.epub");     
    
     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();
    
     // Call the ConvertEPUB method to convert EPUB to PDF
     Converter.ConvertEPUB(stream, options, "output.pdf"); 	 


Преобразование MHTML в PDF — C#


     
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...   
	
	 // Open an existing MHTML file for reading
     using var stream = File.OpenRead("input.mht");     
    
     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();
    
     // Call the ConvertMHTML method to convert MHTML to PDF
     Converter.ConvertMHTML(stream, options, output.pdf); 



Вы можете попробовать онлайн Конвертер MHTML и онлайн Конвертер EPUB. Наши браузерные инструменты конвертации работают на всех платформах, включая Windows , Linux, Mac OS, Android и iOS. Конвертеры совместимы со всеми ПК, смартфонами и планшетами.

Веб-скрейпинг

Веб-скрапинг - извлечение веб-данных или веб-сканирование, представляет собой метод извлечения данных с веб-сайта. Aspose.HTML не поддерживает встроенный модуль Web Scraping. Однако, используя Aspose.HTML API, который полностью основан на спецификации W3C и поддерживает запросы XPath и CSS Selector, вы можете легко проверить содержимое любого HTML-документа и создать собственное решение для веб-скрейпинга.

Aspose.HTML for .NET предлагает Web Scraper, бесплатный и простой в использовании инструмент, который может перемещаться по веб-сайту и извлекать необходимые данные. Мы сделали веб-скрапинг быстрым и эффективным. Извлечение данных выполняется в вашем браузере и не требует установки чего-либо на ваш компьютер. Начните парсинг данных прямо сейчас!

Простое извлечение веб-данных — C#


     
using Aspose.Html;
...

    // Create an instance of the HTML document with a website as a parameter
    using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");

    // Get all anchor-elements
    var elements = document.QuerySelectorAll("a");

    // Dump the anchor-element data to the console
    elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
        {
            System.Console.WriteLine("[Href]: " + x.Href);
            System.Console.WriteLine("[Content]: " + x.TextContent);
        });



Aspose.HTML предлагает бесплатные онлайн-приложения Data Scrapers, способ получения данных с веб-сайтов. Наши приложения безопасны, работают на любой платформе и не требуют установки программного обеспечения. Парсеры данных можно использовать для извлечения изображений, получения ключевых слов с веб-страницы и т. д. Они просты и понятны в использовании, но при этом действенны и надежны.


Другие поддерживаемые функции Aspose.HTML для .NET API

Используйте библиотеку C# Aspose.HTML для конвертации, объединения, редактирования HTML-документов, извлечения данных из Интернета и многого другого!



  
  

Aspose.HTML предлагает отдельные API-интерфейсы обработки HTML для других популярных сред разработки, перечисленных ниже: