So laden Sie HTML in C#
Das Laden von HTML ist ein grundlegender Vorgang für verschiedene Webaufgaben, einschließlich Webentwicklung, Webseiten-Rendering, Datenextraktion, Inhaltsverwaltung, Dokumentenverarbeitung, Tests und mehr. Die Bibliothek Aspose.HTML for .NET stellt eine HTMLDocument -Klasse mit einer Reihe von HTMLDocument() -Konstruktoren bereit, die HTML laden und ein HTMLDocument-Objekt für zukünftige Bearbeitungen initialisieren. HTML-Dokumente können aus einer Datei oder URL geladen und aus einer Zeichenfolge oder einem Speicherstream erstellt und geladen werden. Schauen wir uns also Möglichkeiten zum Laden von HTML an!
Stellen Sie zunächst sicher, dass Aspose.HTML for .NET in Ihrem Projekt installiert ist. Der Installationsprozess dieser Bibliothek ist relativ einfach. Sie können es über die NuGet Package Manager-Konsole mit dem folgenden Befehl installieren:
Installieren Sie Aspose.HTML for .NET
Install-Package Aspose.HTML
Laden Sie HTML aus einer Datei
Das Laden von HTML aus einer Datei ist ein guter Ausgangspunkt für die Arbeit mit vorhandenen HTML-Dateien, Vorlagen oder im HTML-Format gespeicherten Daten. Wenn Sie eine vorhandene HTML-Datei aus einer Datei laden, bearbeiten und speichern müssen, hilft Ihnen das folgende Code-Snippet:
- Laden Sie ein HTML-Dokument aus einer Datei mit dem Konstruktor HTMLDocument(address) , der das HTML-Dokument von einer Adresse (lokaler Dokumentpfad) lädt.
- Speichern Sie die HTML-Datei mit der Methode Save() .
Die Bibliothek Aspose.HTML for .NET bietet eine Reihe von Konstruktoren, mit denen Sie HTML-Dokumente aus einer Datei laden können. Beispielsweise lädt HTMLDocument(address, сonfiguration) ein HTML-Dokument von einer Adresse mit angegebenen Umgebungskonfigurationseinstellungen. Weitere Informationen finden Sie im Kapitel API-Referenz HTMLDocument .
C#-Code zum Laden von HTML aus einer Datei
using System.IO;
using Aspose.Html;
...
// Prepare a file path
string documentPath = Path.Combine(DataDir, "sprite.html");
// Initialize an HTML document from the file
using (var document = new HTMLDocument(documentPath))
{
// Work with the document
// Save the document to a disk
document.Save(Path.Combine(OutputDir, "sprite_out.html"));
}
Laden Sie HTML von einer URL
Das Laden von HTML von einer URL kann nützlich sein, wenn Sie Informationen aus einer Webseite extrahieren müssen. Sie können HTML direkt von einer URL laden:
- Laden Sie ein HTML-Dokument von einer URL mit dem Konstruktor HTMLDocument(Url) . Sie können HTMLDocument(Url, сonfiguration) verwenden, wenn Sie HTML von einer URL mit angegebenen Umgebungskonfigurationseinstellungen laden möchten.
- Verwenden Sie die Eigenschaft OuterHTM , um den vollständigen HTML-Inhalt des Dokuments abzurufen. Dazu gehört der HTML-Code des gesamten Dokuments, einschließlich des HTML-Elements selbst.
Wenn Sie das HTML-Dokument auf Ihrem lokalen Laufwerk speichern müssen, verwenden Sie die Methode Save() .
C#-Code zum Laden von HTML von einer URL
using System.IO;
using Aspose.Html;
...
// Load a document from 'https://docs.aspose.com/html/net/creating-a-document/' web page
using (var document = new HTMLDocument("https://docs.aspose.com/html/net/creating-a-document/"))
{
var html = document.DocumentElement.OuterHTML;
// Write the document content to the output stream
Console.WriteLine(html);
}
Laden Sie HTML aus einer Zeichenfolge
Das Laden von HTML aus einer Zeichenfolge ist eine wichtige Funktion, die es Ihnen ermöglicht, HTML-Inhalte zu bearbeiten und unstrukturierte HTML-Zeichenfolgen in ein strukturiertes Dokument umzuwandeln, das Sie bearbeiten, analysieren oder anzeigen können:
- Bereiten Sie zunächst den Code für ein HTML-Dokument vor.
- Verwenden Sie den Konstruktor HTMLDocument(content, baseUri) , um ein HTML-Dokument aus einem Zeichenfolgeninhalt mit dem angegebenen baseUri zu initialisieren.
- Speichern Sie die HTML-Datei mit der Methode Save() .
C#-Code zum Laden von HTML aus einer Zeichenfolge
using System.IO;
using Aspose.Html;
...
// Prepare HTML code
var html_code = "<p>Learn how to load HTML</p>";
// Initialize a document from the string variable
using (var document = new HTMLDocument(html_code, "."))
{
// Save the document to a disk
document.Save(Path.Combine(OutputDir, "load-html-from-string.html"));
}
Laden Sie HTML aus einem Speicherstream
Das Laden von HTML aus einem Stream ist nützlich für die Speichereffizienz oder die Arbeit mit In-Memory-Daten. Der folgende C#-Code zeigt, wie man HTML aus einem MemoryStream lädt und mit Aspose.HTML for .NET in einer Datei speichert:
- Objekte von
MemoryStream
undStreamWriter
initialisieren. StreamWriter wird verwendet, um den HTML-Code in den MemoryStream zu schreiben. - Schreiben Sie den HTML-Code mit der Methode
Write()
in MemoryStream. - Rufen Sie
Flush()
auf, um sicherzustellen, dass alle gepufferten Daten in den Stream geschrieben werden, und verwenden SieSeek(0, SeekOrigin.Begin)
, um die Position des Streams auf den Anfang zu setzen. Dies ist wichtig, da ein HTMLDocument den Inhalt von der aktuellen Position innerhalb des Streams liest. - Initialisieren Sie das
HTMLDocument
aus dem MemoryStream mit dem Konstruktor HTMLDocument(content, baseUri) . Die Instanz von HTMLDocument wird erstellt, indem das MemoryStream-Objekt und der baseUri als Parameter übergeben werden. - Speichern Sie die HTML-Datei mit der Methode Save() auf einem lokalen Laufwerk.
C#-Code zum Laden von HTML aus einem Speicherstream
using System.IO;
using Aspose.Html;
...
// Create a memory stream object
using (var mem = new MemoryStream())
using (var sw = new StreamWriter(mem))
{
// Write the HTML code into the memory object
sw.Write("<p>Load HTML from a memory stream</p>");
// It is important to set the position to the beginning, since HTMLDocument starts the reading exactly from the current position within the stream
sw.Flush();
mem.Seek(0, SeekOrigin.Begin);
// Initialize a document from the string variable
using (var document = new HTMLDocument(mem, "."))
{
// Save the document to a local disk
document.Save(Path.Combine(OutputDir, "load-html-from-stream.html"));
}
}
Um mehr über die Aspose.HTML-API zu erfahren, besuchen Sie bitte unseren Dokumentation -Leitfaden. Im Artikel Create HTML Document finden Sie Informationen zum Laden eines Dokuments aus einer Datei, URL und einem Stream oder zum Erstellen von Grund auf. Der Dokumentationsartikel Edit HTML Document enthält grundlegende Informationen zum Lesen oder Bearbeiten des Dokumentobjektmodells mit Aspose.HTML for .NET API. Sie erfahren, wie Sie HTML-Elemente erstellen und mit ihnen arbeiten – ändern Sie das Dokument, indem Sie neue Knoten einfügen, entfernen oder den Inhalt vorhandener Knoten bearbeiten.
Andere unterstützte Editoren
Bearbeiten Sie Dateien in anderen Dateiformaten: