วิธีโหลด HTML ใน C#

การโหลด HTML เป็นการดำเนินการพื้นฐานสำหรับงานเว็บต่างๆ รวมถึงการพัฒนาเว็บ การแสดงหน้าเว็บ การดึงข้อมูล การจัดการเนื้อหา การประมวลผลเอกสาร การทดสอบ และอื่นๆ ไลบรารี Aspose.HTML สำหรับ .NET จัดให้มีคลาส HTMLDocument พร้อมด้วยชุดของตัวสร้าง HTMLDocument() ที่โหลด HTML และเตรียมใช้งานวัตถุ HTMLDocument สำหรับการจัดการในอนาคต เอกสาร HTML สามารถโหลดจากไฟล์หรือ URL และสามารถสร้างและโหลดจากสตริงหรือสตรีมหน่วยความจำได้ มาดูวิธีการโหลด HTML กันดีกว่า!

ขั้นแรก ตรวจสอบให้แน่ใจว่าคุณได้ Aspose.HTML สำหรับ .NET ติดตั้ง ในโปรเจ็กต์ของคุณ กระบวนการติดตั้งไลบรารีนี้ค่อนข้างง่าย คุณสามารถติดตั้งผ่านคอนโซล NuGet Package Manager โดยใช้คำสั่งต่อไปนี้:


ติดตั้ง Aspose.HTML สำหรับ .NET

Install-Package Aspose.HTML

โหลด HTML จากไฟล์

การโหลด HTML จากไฟล์เป็นจุดเริ่มต้นที่ดีสำหรับการทำงานกับไฟล์ HTML เทมเพลต หรือข้อมูลที่จัดเก็บในรูปแบบ HTML ที่มีอยู่ หากคุณจำเป็นต้องโหลดไฟล์ HTML ที่มีอยู่จากไฟล์ แก้ไขและบันทึกไฟล์ ข้อมูลโค้ดต่อไปนี้จะช่วยคุณได้:

  1. โหลดเอกสาร HTML จากไฟล์โดยใช้ตัวสร้าง HTMLDocument(address) ที่โหลดเอกสาร HTML จากที่อยู่ (เส้นทางเอกสารในเครื่อง)
  2. บันทึกไฟล์ HTML โดยใช้วิธี Save()

Aspose.HTML สำหรับไลบรารี .NET มีชุดตัวสร้างที่ช่วยให้คุณสามารถโหลดเอกสาร HTML จากไฟล์ได้ ตัวอย่างเช่น HTMLDocument(address, configuration) โหลดเอกสาร HTML จากที่อยู่ที่มีการตั้งค่าการกำหนดค่าสภาพแวดล้อมที่ระบุ สำหรับข้อมูลเพิ่มเติม โปรดดูบทอ้างอิง API HTMLDocument


รหัส C# เพื่อโหลด HTML จากไฟล์

using System.IO;
using Aspose.Html;
...

    // Prepare a file path
	string documentPath = Path.Combine(DataDir, "sprite.html");

	// Initialize an HTML document from the file
	using (var document = new HTMLDocument(documentPath))
	{
		// Work with the document

		// Save the document to a disk
		document.Save(Path.Combine(OutputDir, "sprite_out.html"));
	}

โหลด HTML จาก URL

การโหลด HTML จาก URL จะมีประโยชน์เมื่อคุณต้องการดึงข้อมูลจากหน้าเว็บ คุณสามารถโหลด HTML ได้โดยตรงจาก URL:

  1. โหลดเอกสาร HTML จาก URL โดยใช้ตัวสร้าง HTMLDocument(Url) คุณสามารถใช้ HTMLDocument(Url, configuration) ได้ หากคุณต้องการโหลด HTML จาก URL ด้วยการตั้งค่าการกำหนดค่าสภาพแวดล้อมที่ระบุ
  2. ใช้คุณสมบัติ OuterHTM เพื่อรับเนื้อหา HTML ที่สมบูรณ์ของเอกสาร ซึ่งรวมถึง HTML ของเอกสารทั้งหมด รวมถึงองค์ประกอบ HTML ด้วย

หากคุณต้องการบันทึกเอกสาร HTML ลงในไดรฟ์ในเครื่องของคุณ ให้ใช้วิธี Save()


รหัส C# เพื่อโหลด HTML จาก URL

using System.IO;
using Aspose.Html;
...

	// Load a document from 'https://docs.aspose.com/html/net/creating-a-document/' web page
	using (var document = new HTMLDocument("https://docs.aspose.com/html/net/creating-a-document/"))
	{
		var html = document.DocumentElement.OuterHTML;

		// Write the document content to the output stream
		Console.WriteLine(html);
	}

โหลด HTML จากสตริง

การโหลด HTML จากสตริงเป็นความสามารถที่สำคัญที่ช่วยให้คุณสามารถจัดการเนื้อหา HTML และแปลงสตริง HTML ที่ไม่มีโครงสร้างให้เป็นเอกสารที่มีโครงสร้างซึ่งคุณสามารถจัดการ แยกวิเคราะห์ หรือแสดงได้:

  1. ขั้นแรก เตรียมโค้ดสำหรับเอกสาร HTML
  2. ใช้ตัวสร้าง HTMLDocument(content, baseUri) เพื่อเริ่มต้นเอกสาร HTML จากเนื้อหาสตริงที่มี baseUri ที่ระบุ
  3. บันทึกไฟล์ HTML โดยใช้วิธี Save()

รหัส C# เพื่อโหลด HTML จากสตริง

using System.IO;
using Aspose.Html;
...

	// Prepare HTML code
    var html_code = "<p>Learn how to load HTML</p>";

    // Initialize a document from the string variable
    using (var document = new HTMLDocument(html_code, "."))
    {
        // Save the document to a disk
        document.Save(Path.Combine(OutputDir, "load-html-from-string.html"));
    }

โหลด HTML จากสตรีมหน่วยความจำ

การโหลด HTML จากสตรีมมีประโยชน์สำหรับประสิทธิภาพของหน่วยความจำหรือการทำงานกับข้อมูลในหน่วยความจำ รหัส C# ต่อไปนี้สาธิตวิธีการโหลด HTML จาก MemoryStream และบันทึกลงในไฟล์โดยใช้ Aspose.HTML สำหรับ .NET:

  1. เริ่มต้นวัตถุของ MemoryStream และ StreamWriter StreamWriter ใช้เพื่อเขียนโค้ด HTML ลงใน MemoryStream
  2. เขียนโค้ด HTML ไปยัง MemoryStream โดยใช้วิธี Write()
  3. เรียก Flush() เพื่อให้แน่ใจว่าข้อมูลบัฟเฟอร์ใดๆ ถูกเขียนลงในสตรีม และใช้ Seek(0, SeekOrigin.Begin) เพื่อกำหนดตำแหน่งของสตรีมไปที่จุดเริ่มต้น นี่เป็นสิ่งสำคัญเนื่องจาก HTMLDocument อ่านเนื้อหาจากตำแหน่งปัจจุบันภายในสตรีม
  4. เริ่มต้น HTMLDocument จาก MemoryStream โดยใช้ตัวสร้าง HTMLDocument(content, baseUri) อินสแตนซ์ของ HTMLDocument ถูกสร้างขึ้นโดยการส่งวัตถุ MemoryStream และ baseUri เป็นพารามิเตอร์
  5. บันทึกไฟล์ HTML ลงในไดรฟ์ภายในเครื่องโดยใช้วิธี Save()

รหัส C# เพื่อโหลด HTML จากสตรีมหน่วยความจำ

using System.IO;
using Aspose.Html;
...

    // Create a memory stream object
	using (var mem = new MemoryStream())
	using (var sw = new StreamWriter(mem))
	{
		// Write the HTML code into the memory object
		sw.Write("<p>Load HTML from a memory stream</p>");

		// It is important to set the position to the beginning, since HTMLDocument starts the reading exactly from the current position within the stream
		sw.Flush();
		mem.Seek(0, SeekOrigin.Begin);

		// Initialize a document from the string variable
		using (var document = new HTMLDocument(mem, "."))
		{
			// Save the document to a local disk
			document.Save(Path.Combine(OutputDir, "load-html-from-stream.html"));
		}
	}

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Aspose.HTML API โปรดไปที่คำแนะนำ เอกสารประกอบ ของเรา จากบทความ Create HTML Document คุณจะพบข้อมูลเกี่ยวกับวิธีการโหลดเอกสารจากไฟล์ URL และสตรีม หรือสร้างตั้งแต่ต้น บทความเอกสารประกอบ Edit HTML Document ให้ข้อมูลพื้นฐานเกี่ยวกับวิธีอ่านหรือแก้ไข Document Object Model โดยใช้ Aspose.HTML สำหรับ .NET API คุณจะได้สำรวจวิธีการสร้างองค์ประกอบ HTML และวิธีการทำงานกับองค์ประกอบเหล่านั้น – แก้ไขเอกสารโดยการแทรกโหนดใหม่ การลบ หรือแก้ไขเนื้อหาของโหนดที่มีอยู่