Comment modifier MHTML en C#
Les fichiers MHTML représentent un format d’archive de page Web qui peut être créé par un certain nombre d’applications différentes. Le format est connu sous le nom de format d’archive car il enregistre le code HTML Web et les ressources associées dans un seul fichier.
Nous modifierons les fichiers MHTML à l’aide de
Aspose.HTML pour .NET API
qui est une API riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme C#. L’espace de noms
Aspose.Html.Dom
(Document Object Model) contient des classes et des méthodes permettant de manipuler des documents HTML à la volée. Vous pouvez insérer, supprimer, remplacer des nœuds HTML, extraire des informations de style CSS, obtenir le contenu des éléments et naviguer dans le document HTML à l’aide de divers sélecteurs de données.
Remarque : L’édition de documents MHTML passe par l’étape de l’édition de documents HTML. Vous pouvez charger un document HTML, le modifier et l’enregistrer au format MHTML.
Code pour éditer le fichier MHTML à l'aide de C#
À l’aide de la bibliothèque C#, vous pouvez modifier par programmation des documents MHTML – modifier la structure, le style et le contenu du document. Voyons comment styliser l’élément de paragraphe <p>
dans un fichier MHTML. Nous ajoutons l’attribut style
au premier élément de paragraphe du document.
Code C# pour éditer les fichiers MHTML
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Create a CSS Selector that extracts the first paragraph element in the document
var element = document.QuerySelector("p");
// Print content of the first paragraph
Output.WriteLine(element.InnerHTML);
// output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.
// Set style attribute with properties for the selected element
element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
Étapes pour styliser l'élément de paragraphe dans le document MHTML à l'aide de C#
Envisagez des étapes simples pour modifier un document existant. Dans le document, nous allons styliser le premier paragraphe:
- Chargez un document HTML en utilisant l’un des constructeurs HTMLDocument() . Vous pouvez charger du HTML à partir d’un fichier, d’un code HTML, d’un flux ou d’une URL.
- Créez un sélecteur CSS qui extrait le premier élément du document correspondant au sélecteur. Utilisez la méthode
QuerySelector(“p”)
de la classe Document qui renvoie le premier élément
<p>
dans le document. - Définissez l’attribut de style avec les propriétés de l’élément sélectionné. Utilisez la méthode SetAttribute() pour ajouter l’attribut style avec ses paires propriété & valeur.
- Créez un objet d’options de sauvegarde MHTML à l’aide du constructeur MHTMLSaveOptions() .
- Enregistrez le fichier HTML modifié en tant que document MHTML à l’aide de la méthode Save() .
Comment supprimer un élément d'un fichier MHTML en C#
L’exemple de code C# suivant montre comment supprimer le dernier paragraphe d’un document MHTML:
Code C# pour éditer les fichiers MHTML
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Find the last document paragraph element
var p = document.GetElementsByTagName("p").Last();
// Remove paragraph element
p.Remove();
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
Documentation
Pour en savoir plus sur l’API Aspose.HTML, veuillez consulter notre
documentation
guide et
API Reference.
Vous pouvez télécharger les exemples et les projets de démonstration à partir du référentiel
GitHub
. Ils sont open source et peuvent être librement utilisés dans vos propres applications.
L’article de documentation
Modifier le document HTML
vous donne des informations de base sur la façon de lire ou de modifier le modèle d’objet de document à l’aide d’Aspose.HTML pour l’API .NET. Vous découvrirez comment créer des éléments HTML et comment les utiliser: modifiez le document en insérant de nouveaux nœuds, en supprimant ou en modifiant le contenu des nœuds existants.
Les articles du chapitre How-To Articles répondent aux questions courantes sur l’utilisation des fichiers HTML. En outre, les articles contiennent des exemples C# qui fournissent les informations nécessaires sur l’utilisation de la bibliothèque de classes Aspose.HTML pour résoudre des tâches spécifiques, telles que la modification du style de texte dans un paragraphe, l’application efficace de sélecteurs pour sélectionner les éléments que vous souhaitez modifier, etc
FAQ
La bibliothèque Aspose.HTML for .NET est une solution d’édition MHTML autonome qui ne dépend pas d’autres logiciels. Installez notre bibliothèque C#, ajoutez la référence de la bibliothèque à votre projet C# et modifiez et gérez par programmation les documents MHTML.
Veuillez consulter notre documentation pour en savoir plus sur l’utilisation de l’API Aspose.HTML for .NET pour modifier MHTML. Si vous avez des questions sur les fonctionnalités, si vous rencontrez des problèmes ou si vous avez besoin d’une nouvelle fonctionnalité, veuillez lancer une discussion sur notre forum d’assistance gratuit.
Vous pouvez modifier des documents MHTML sur n’importe quel système d’exploitation, que vous utilisiez Windows, Mac OS, Linux, Android ou iOS.
Nous prenons en charge quelques formats de fichiers que vous pouvez modifier en C#, notamment HTML, MHTML et Markdown.
Premiers pas avec l'API HTML .NET
Vous pouvez utiliser plusieurs méthodes pour installer la bibliothèque Aspose.HTML pour .NET sur votre système :
- Installez un package NuGet à l’aide de l’interface graphique du gestionnaire de packages NuGet.
- Installez un package NuGet à l’aide de la console du gestionnaire de packages. Vous pouvez utiliser la commande suivante
PM> Install-Package Aspose.Html
. - Installez Aspose.HTML pour .NET via MSI.
Cette bibliothèque prend en charge l’analyse de HTML5, CSS3, SVG et HTML Canvas pour construire un modèle d’objet de document (DOM) basé sur la norme WHATWG DOM. Aspose.HTML pour .NET est entièrement écrit en C# et peut être utilisé pour créer tout type d’application .NET 32 bits ou 64 bits, y compris ASP.NET, WCF, WinForms et .NET Core. Avant d’exécuter l’exemple de code de conversion .NET, assurez-vous que vous disposez d’un système d’exploitation tel que Microsoft Windows ou compatible avec .NET Framework ou .NET Standard, et d’un environnement de développement tel que Microsoft Visual Studio. Pour plus de détails sur l’installation de la bibliothèque C# et la configuration système requise, veuillez consulter Aspose.HTML Documentation.
Autres éditeurs pris en charge
Modifiez des fichiers dans d'autres formats de fichier: