วิธีโหลด HTML ใน C#
การโหลด HTML เป็นการดำเนินการพื้นฐานสำหรับงานเว็บต่างๆ รวมถึงการพัฒนาเว็บ การแสดงหน้าเว็บ การดึงข้อมูล การจัดการเนื้อหา การประมวลผลเอกสาร การทดสอบ และอื่นๆ ไลบรารี Aspose.HTML for .NET จัดให้มีคลาส HTMLDocument พร้อมด้วยชุดของตัวสร้าง HTMLDocument() ที่โหลด HTML และเตรียมใช้งานวัตถุ HTMLDocument สำหรับการจัดการในอนาคต เอกสาร HTML สามารถโหลดจากไฟล์หรือ URL และสามารถสร้างและโหลดจากสตริงหรือสตรีมหน่วยความจำได้ มาดูวิธีการโหลด HTML กันดีกว่า!
ขั้นแรก ตรวจสอบให้แน่ใจว่าคุณได้ Aspose.HTML for .NET ติดตั้ง ในโปรเจ็กต์ของคุณ กระบวนการติดตั้งไลบรารีนี้ค่อนข้างง่าย คุณสามารถติดตั้งผ่านคอนโซล NuGet Package Manager โดยใช้คำสั่งต่อไปนี้:
ติดตั้ง Aspose.HTML for .NET
Install-Package Aspose.HTML
โหลด HTML จากไฟล์
การโหลด HTML จากไฟล์เป็นจุดเริ่มต้นที่ดีสำหรับการทำงานกับไฟล์ HTML เทมเพลต หรือข้อมูลที่จัดเก็บในรูปแบบ HTML ที่มีอยู่ หากคุณจำเป็นต้องโหลดไฟล์ HTML ที่มีอยู่จากไฟล์ แก้ไขและบันทึกไฟล์ ข้อมูลโค้ดต่อไปนี้จะช่วยคุณได้:
- โหลดเอกสาร HTML จากไฟล์โดยใช้ตัวสร้าง HTMLDocument(address) ที่โหลดเอกสาร HTML จากที่อยู่ (เส้นทางเอกสารในเครื่อง)
- บันทึกไฟล์ HTML โดยใช้วิธี Save()
Aspose.HTML สำหรับไลบรารี .NET มีชุดตัวสร้างที่ช่วยให้คุณสามารถโหลดเอกสาร HTML จากไฟล์ได้ ตัวอย่างเช่น HTMLDocument(address, configuration) โหลดเอกสาร HTML จากที่อยู่ที่มีการตั้งค่าการกำหนดค่าสภาพแวดล้อมที่ระบุ สำหรับข้อมูลเพิ่มเติม โปรดดูบทอ้างอิง API HTMLDocument
รหัส C# เพื่อโหลด HTML จากไฟล์
using System.IO;
using Aspose.Html;
...
// Prepare a file path
string documentPath = Path.Combine(DataDir, "sprite.html");
// Initialize an HTML document from the file
using (var document = new HTMLDocument(documentPath))
{
// Work with the document
// Save the document to a disk
document.Save(Path.Combine(OutputDir, "sprite_out.html"));
}
โหลด HTML จาก URL
การโหลด HTML จาก URL จะมีประโยชน์เมื่อคุณต้องการดึงข้อมูลจากหน้าเว็บ คุณสามารถโหลด HTML ได้โดยตรงจาก URL:
- โหลดเอกสาร HTML จาก URL โดยใช้ตัวสร้าง HTMLDocument(Url) คุณสามารถใช้ HTMLDocument(Url, configuration) ได้ หากคุณต้องการโหลด HTML จาก URL ด้วยการตั้งค่าการกำหนดค่าสภาพแวดล้อมที่ระบุ
- ใช้คุณสมบัติ OuterHTM เพื่อรับเนื้อหา HTML ที่สมบูรณ์ของเอกสาร ซึ่งรวมถึง HTML ของเอกสารทั้งหมด รวมถึงองค์ประกอบ HTML ด้วย
หากคุณต้องการบันทึกเอกสาร HTML ลงในไดรฟ์ในเครื่องของคุณ ให้ใช้วิธี Save()
รหัส C# เพื่อโหลด HTML จาก URL
using System.IO;
using Aspose.Html;
...
// Load a document from 'https://docs.aspose.com/html/net/creating-a-document/' web page
using (var document = new HTMLDocument("https://docs.aspose.com/html/net/creating-a-document/"))
{
var html = document.DocumentElement.OuterHTML;
// Write the document content to the output stream
Console.WriteLine(html);
}
โหลด HTML จากสตริง
การโหลด HTML จากสตริงเป็นความสามารถที่สำคัญที่ช่วยให้คุณสามารถจัดการเนื้อหา HTML และแปลงสตริง HTML ที่ไม่มีโครงสร้างให้เป็นเอกสารที่มีโครงสร้างซึ่งคุณสามารถจัดการ แยกวิเคราะห์ หรือแสดงได้:
- ขั้นแรก เตรียมโค้ดสำหรับเอกสาร HTML
- ใช้ตัวสร้าง
HTMLDocument(
content, baseUri
) เพื่อเริ่มต้นเอกสาร HTML จากเนื้อหาสตริงที่มี baseUri ที่ระบุ - บันทึกไฟล์ HTML โดยใช้วิธี Save()
รหัส C# เพื่อโหลด HTML จากสตริง
using System.IO;
using Aspose.Html;
...
// Prepare HTML code
var html_code = "<p>Learn how to load HTML</p>";
// Initialize a document from the string variable
using (var document = new HTMLDocument(html_code, "."))
{
// Save the document to a disk
document.Save(Path.Combine(OutputDir, "load-html-from-string.html"));
}
โหลด HTML จากสตรีมหน่วยความจำ
การโหลด HTML จากสตรีมมีประโยชน์สำหรับประสิทธิภาพของหน่วยความจำหรือการทำงานกับข้อมูลในหน่วยความจำ รหัส C# ต่อไปนี้สาธิตวิธีการโหลด HTML จาก MemoryStream และบันทึกลงในไฟล์โดยใช้ Aspose.HTML for .NET:
- เริ่มต้นวัตถุของ
MemoryStream
และStreamWriter
StreamWriter ใช้เพื่อเขียนโค้ด HTML ลงใน MemoryStream - เขียนโค้ด HTML ไปยัง MemoryStream โดยใช้วิธี
Write()
- เรียก
Flush()
เพื่อให้แน่ใจว่าข้อมูลบัฟเฟอร์ใดๆ ถูกเขียนลงในสตรีม และใช้Seek(0, SeekOrigin.Begin)
เพื่อกำหนดตำแหน่งของสตรีมไปที่จุดเริ่มต้น นี่เป็นสิ่งสำคัญเนื่องจาก HTMLDocument อ่านเนื้อหาจากตำแหน่งปัจจุบันภายในสตรีม - เริ่มต้น
HTMLDocument
จาก MemoryStream โดยใช้ตัวสร้าง HTMLDocument(content, baseUri
) อินสแตนซ์ของ HTMLDocument ถูกสร้างขึ้นโดยการส่งวัตถุ MemoryStream และ baseUri เป็นพารามิเตอร์ - บันทึกไฟล์ HTML ลงในไดรฟ์ภายในเครื่องโดยใช้วิธี Save()
รหัส C# เพื่อโหลด HTML จากสตรีมหน่วยความจำ
using System.IO;
using Aspose.Html;
...
// Create a memory stream object
using (var mem = new MemoryStream())
using (var sw = new StreamWriter(mem))
{
// Write the HTML code into the memory object
sw.Write("<p>Load HTML from a memory stream</p>");
// It is important to set the position to the beginning, since HTMLDocument starts the reading exactly from the current position within the stream
sw.Flush();
mem.Seek(0, SeekOrigin.Begin);
// Initialize a document from the string variable
using (var document = new HTMLDocument(mem, "."))
{
// Save the document to a local disk
document.Save(Path.Combine(OutputDir, "load-html-from-stream.html"));
}
}
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Aspose.HTML API โปรดไปที่คำแนะนำ เอกสารประกอบ ของเรา จากบทความ Create HTML Document คุณจะพบข้อมูลเกี่ยวกับวิธีการโหลดเอกสารจากไฟล์ URL และสตรีม หรือสร้างตั้งแต่ต้น บทความเอกสารประกอบ Edit HTML Document ให้ข้อมูลพื้นฐานเกี่ยวกับวิธีอ่านหรือแก้ไข Document Object Model โดยใช้ Aspose.HTML for .NET API คุณจะได้สำรวจวิธีการสร้างองค์ประกอบ HTML และวิธีการทำงานกับองค์ประกอบเหล่านั้น – แก้ไขเอกสารโดยการแทรกโหนดใหม่ การลบ หรือแก้ไขเนื้อหาของโหนดที่มีอยู่