So laden Sie HTML in C#

Das Laden von HTML ist ein grundlegender Vorgang für verschiedene Webaufgaben, einschließlich Webentwicklung, Webseiten-Rendering, Datenextraktion, Inhaltsverwaltung, Dokumentenverarbeitung, Tests und mehr. Die Bibliothek Aspose.HTML für .NET stellt eine HTMLDocument -Klasse mit einer Reihe von HTMLDocument() -Konstruktoren bereit, die HTML laden und ein HTMLDocument-Objekt für zukünftige Bearbeitungen initialisieren. HTML-Dokumente können aus einer Datei oder URL geladen und aus einer Zeichenfolge oder einem Speicherstream erstellt und geladen werden. Schauen wir uns also Möglichkeiten zum Laden von HTML an!

Stellen Sie zunächst sicher, dass Aspose.HTML für .NET in Ihrem Projekt installiert ist. Der Installationsprozess dieser Bibliothek ist relativ einfach. Sie können es über die NuGet Package Manager-Konsole mit dem folgenden Befehl installieren:


Installieren Sie Aspose.HTML für .NET

Install-Package Aspose.HTML

Laden Sie HTML aus einer Datei

Das Laden von HTML aus einer Datei ist ein guter Ausgangspunkt für die Arbeit mit vorhandenen HTML-Dateien, Vorlagen oder im HTML-Format gespeicherten Daten. Wenn Sie eine vorhandene HTML-Datei aus einer Datei laden, bearbeiten und speichern müssen, hilft Ihnen das folgende Code-Snippet:

  1. Laden Sie ein HTML-Dokument aus einer Datei mit dem Konstruktor HTMLDocument(address) , der das HTML-Dokument von einer Adresse (lokaler Dokumentpfad) lädt.
  2. Speichern Sie die HTML-Datei mit der Methode Save() .

Die Bibliothek Aspose.HTML für .NET bietet eine Reihe von Konstruktoren, mit denen Sie HTML-Dokumente aus einer Datei laden können. Beispielsweise lädt HTMLDocument(address, сonfiguration) ein HTML-Dokument von einer Adresse mit angegebenen Umgebungskonfigurationseinstellungen. Weitere Informationen finden Sie im Kapitel API-Referenz HTMLDocument .


C#-Code zum Laden von HTML aus einer Datei

using System.IO;
using Aspose.Html;
...

    // Prepare a file path
	string documentPath = Path.Combine(DataDir, "sprite.html");

	// Initialize an HTML document from the file
	using (var document = new HTMLDocument(documentPath))
	{
		// Work with the document

		// Save the document to a disk
		document.Save(Path.Combine(OutputDir, "sprite_out.html"));
	}

Laden Sie HTML von einer URL

Das Laden von HTML von einer URL kann nützlich sein, wenn Sie Informationen aus einer Webseite extrahieren müssen. Sie können HTML direkt von einer URL laden:

  1. Laden Sie ein HTML-Dokument von einer URL mit dem Konstruktor HTMLDocument(Url) . Sie können HTMLDocument(Url, сonfiguration) verwenden, wenn Sie HTML von einer URL mit angegebenen Umgebungskonfigurationseinstellungen laden möchten.
  2. Verwenden Sie die Eigenschaft OuterHTM , um den vollständigen HTML-Inhalt des Dokuments abzurufen. Dazu gehört der HTML-Code des gesamten Dokuments, einschließlich des HTML-Elements selbst.

Wenn Sie das HTML-Dokument auf Ihrem lokalen Laufwerk speichern müssen, verwenden Sie die Methode Save() .


C#-Code zum Laden von HTML von einer URL

using System.IO;
using Aspose.Html;
...

	// Load a document from 'https://docs.aspose.com/html/net/creating-a-document/' web page
	using (var document = new HTMLDocument("https://docs.aspose.com/html/net/creating-a-document/"))
	{
		var html = document.DocumentElement.OuterHTML;

		// Write the document content to the output stream
		Console.WriteLine(html);
	}

Laden Sie HTML aus einer Zeichenfolge

Das Laden von HTML aus einer Zeichenfolge ist eine wichtige Funktion, die es Ihnen ermöglicht, HTML-Inhalte zu bearbeiten und unstrukturierte HTML-Zeichenfolgen in ein strukturiertes Dokument umzuwandeln, das Sie bearbeiten, analysieren oder anzeigen können:

  1. Bereiten Sie zunächst den Code für ein HTML-Dokument vor.
  2. Verwenden Sie den Konstruktor HTMLDocument(content, baseUri) , um ein HTML-Dokument aus einem Zeichenfolgeninhalt mit dem angegebenen baseUri zu initialisieren.
  3. Speichern Sie die HTML-Datei mit der Methode Save() .

C#-Code zum Laden von HTML aus einer Zeichenfolge

using System.IO;
using Aspose.Html;
...

	// Prepare HTML code
    var html_code = "<p>Learn how to load HTML</p>";

    // Initialize a document from the string variable
    using (var document = new HTMLDocument(html_code, "."))
    {
        // Save the document to a disk
        document.Save(Path.Combine(OutputDir, "load-html-from-string.html"));
    }

Laden Sie HTML aus einem Speicherstream

Das Laden von HTML aus einem Stream ist nützlich für die Speichereffizienz oder die Arbeit mit In-Memory-Daten. Der folgende C#-Code zeigt, wie man HTML aus einem MemoryStream lädt und mit Aspose.HTML für .NET in einer Datei speichert:

  1. Objekte von MemoryStream und StreamWriter initialisieren. StreamWriter wird verwendet, um den HTML-Code in den MemoryStream zu schreiben.
  2. Schreiben Sie den HTML-Code mit der Methode Write() in MemoryStream.
  3. Rufen Sie Flush() auf, um sicherzustellen, dass alle gepufferten Daten in den Stream geschrieben werden, und verwenden Sie Seek(0, SeekOrigin.Begin), um die Position des Streams auf den Anfang zu setzen. Dies ist wichtig, da ein HTMLDocument den Inhalt von der aktuellen Position innerhalb des Streams liest.
  4. Initialisieren Sie das HTMLDocument aus dem MemoryStream mit dem Konstruktor HTMLDocument(content, baseUri) . Die Instanz von HTMLDocument wird erstellt, indem das MemoryStream-Objekt und der baseUri als Parameter übergeben werden.
  5. Speichern Sie die HTML-Datei mit der Methode Save() auf einem lokalen Laufwerk.

C#-Code zum Laden von HTML aus einem Speicherstream

using System.IO;
using Aspose.Html;
...

    // Create a memory stream object
	using (var mem = new MemoryStream())
	using (var sw = new StreamWriter(mem))
	{
		// Write the HTML code into the memory object
		sw.Write("<p>Load HTML from a memory stream</p>");

		// It is important to set the position to the beginning, since HTMLDocument starts the reading exactly from the current position within the stream
		sw.Flush();
		mem.Seek(0, SeekOrigin.Begin);

		// Initialize a document from the string variable
		using (var document = new HTMLDocument(mem, "."))
		{
			// Save the document to a local disk
			document.Save(Path.Combine(OutputDir, "load-html-from-stream.html"));
		}
	}

Um mehr über die Aspose.HTML-API zu erfahren, besuchen Sie bitte unseren Dokumentation -Leitfaden. Im Artikel Create HTML Document finden Sie Informationen zum Laden eines Dokuments aus einer Datei, URL und einem Stream oder zum Erstellen von Grund auf. Der Dokumentationsartikel Edit HTML Document enthält grundlegende Informationen zum Lesen oder Bearbeiten des Dokumentobjektmodells mit Aspose.HTML für die .NET-API. Sie erfahren, wie Sie HTML-Elemente erstellen und mit ihnen arbeiten – ändern Sie das Dokument, indem Sie neue Knoten einfügen, entfernen oder den Inhalt vorhandener Knoten bearbeiten.