วิธีแก้ไข MHTML ใน C#
ไฟล์ MHTML แสดงถึงรูปแบบการเก็บถาวรของหน้าเว็บที่สามารถสร้างโดยแอปพลิเคชันต่างๆ รูปแบบนี้เรียกว่ารูปแบบไฟล์เก็บถาวร เนื่องจากบันทึกโค้ด HTML ของเว็บและทรัพยากรที่เกี่ยวข้องไว้ในไฟล์เดียว
เราจะแก้ไขไฟล์ MHTML โดยใช้
Aspose.HTML for .NET API
ซึ่งเป็น API ที่มีคุณลักษณะหลากหลาย ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม C# เนมสเปซ
Aspose.Html.Dom
(Document Object Model) มีคลาสและเมธอดในการจัดการเอกสาร HTML ได้ทันที คุณสามารถแทรก ลบ แทนที่โหนด HTML ดึงข้อมูลรูปแบบ CSS รับเนื้อหาขององค์ประกอบ และนำทางผ่านเอกสาร HTML ด้วยตัวเลือกข้อมูลที่หลากหลาย
หมายเหตุ: การแก้ไขเอกสาร MHTML จะต้องผ่านขั้นตอนของการแก้ไขเอกสาร HTML คุณสามารถโหลดเอกสาร HTML แก้ไขและบันทึกในรูปแบบ MHTML
รหัสสำหรับแก้ไขไฟล์ MHTML โดยใช้ C#
เมื่อใช้ไลบรารี C# คุณสามารถแก้ไขเอกสาร MHTML โดยทางโปรแกรม – เปลี่ยนโครงสร้าง สไตล์ และเนื้อหาของเอกสาร มาดูวิธีจัดรูปแบบองค์ประกอบย่อหน้า <p>
ในไฟล์ MHTML เราเพิ่มแอตทริบิวต์ style
ให้กับองค์ประกอบย่อหน้าแรกในเอกสาร
รหัส C# เพื่อแก้ไขไฟล์ MHTML
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Create a CSS Selector that extracts the first paragraph element in the document
var element = document.QuerySelector("p");
// Print content of the first paragraph
Output.WriteLine(element.InnerHTML);
// output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.
// Set style attribute with properties for the selected element
element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
ขั้นตอนในการสไตล์องค์ประกอบย่อหน้าในเอกสาร MHTML โดยใช้ C#
พิจารณาขั้นตอนง่ายๆ ในการแก้ไขเอกสารที่มีอยู่ ในเอกสารเราจะจัดรูปแบบย่อหน้าแรก:
- โหลดเอกสาร HTML โดยใช้ตัวสร้าง HTMLDocument() ตัวใดตัวหนึ่ง คุณสามารถโหลด HTML จากไฟล์ โค้ด HTML สตรีม หรือ URL
- สร้างตัวเลือก CSS ที่แยกองค์ประกอบแรกในเอกสารที่ตรงกับตัวเลือก ใช้เมธอด
QuerySelector(“p”)
ของคลาส Document ที่ส่งคืนองค์ประกอบ
<p>
แรกในเอกสาร - ตั้งค่าแอตทริบิวต์สไตล์ด้วยคุณสมบัติสำหรับองค์ประกอบที่เลือก ใช้เมธอด SetAttribute() เพื่อเพิ่มแอตทริบิวต์สไตล์ด้วยคู่คุณสมบัติและค่า
- สร้างวัตถุตัวเลือกการบันทึก MHTML โดยใช้ตัวสร้าง MHTMLSaveOptions()
- บันทึกไฟล์ HTML ที่แก้ไขเป็นเอกสาร MHTML โดยใช้วิธี Save()
วิธีลบองค์ประกอบออกจากไฟล์ MHTML ใน C#
ตัวอย่างรหัส C# ต่อไปนี้แสดงวิธีลบย่อหน้าสุดท้ายในเอกสาร MHTML:
รหัส C# เพื่อแก้ไขไฟล์ MHTML
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Find the last document paragraph element
var p = document.GetElementsByTagName("p").Last();
// Remove paragraph element
p.Remove();
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
เอกสาร
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Aspose.HTML API โปรดไปที่คู่มือ
เอกสาร
และ
ข้อมูลอ้างอิง API
คุณสามารถดาวน์โหลดตัวอย่างและแสดงโครงการได้จากที่เก็บ
GitHub
เป็นโอเพ่นซอร์สและสามารถใช้ได้อย่างอิสระในแอปพลิเคชันของคุณเอง
บทความเอกสาร
Edit HTML Document
ให้ข้อมูลพื้นฐานเกี่ยวกับวิธีอ่านหรือแก้ไข Document Object Model โดยใช้ Aspose.HTML สำหรับ .NET API คุณจะได้สำรวจวิธีสร้างองค์ประกอบ HTML และวิธีทำงานกับองค์ประกอบเหล่านี้ – แก้ไขเอกสารโดยการแทรกโหนดใหม่ ลบ หรือแก้ไขเนื้อหาของโหนดที่มีอยู่
บทความในบท How-To Articles ตอบคำถามยอดนิยมเกี่ยวกับวิธีทำงานกับไฟล์ HTML นอกจากนี้ บทความยังมีตัวอย่างภาษา C# ที่ให้ข้อมูลที่จำเป็นเกี่ยวกับการใช้ไลบรารีคลาส Aspose.HTML เพื่อแก้ปัญหาเฉพาะ เช่น วิธีเปลี่ยนรูปแบบข้อความในย่อหน้า วิธีการใช้ตัวเลือกอย่างมีประสิทธิภาพเพื่อเลือกองค์ประกอบที่คุณต้องการ แก้ไข ฯลฯ
คำถามที่พบบ่อย
ไลบรารี Aspose.HTML for .NET เป็นโซลูชันการแก้ไข MHTML แบบสแตนด์อโลนที่ไม่ขึ้นอยู่กับซอฟต์แวร์อื่น ติดตั้งไลบรารี C# ของเรา เพิ่มการอ้างอิงไลบรารีในโครงการ C# ของคุณ และแก้ไขและจัดการเอกสาร MHTML โดยทางโปรแกรม
โปรดไปที่เอกสารของเราเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับการใช้ Aspose.HTML for .NET API เพื่อแก้ไข MHTML หากคุณมีคำถามเกี่ยวกับฟังก์ชันการทำงาน พบปัญหา หรือต้องการฟีเจอร์ใหม่ โปรดเริ่มการสนทนาในฟอรัมการสนับสนุนฟรีของเรา
คุณสามารถแก้ไขเอกสาร MHTML บนระบบปฏิบัติการใดก็ได้ ไม่ว่าคุณจะใช้ Windows, Mac OS, Linux, Android หรือ iOS
เรารองรับไฟล์บางรูปแบบที่คุณสามารถแก้ไขใน C# ได้ รวมถึง HTML, MHTML และ Markdown
เริ่มต้นใช้งาน .NET HTML API
คุณสามารถใช้หลายวิธีในการติดตั้งไลบรารี Aspose.HTML สำหรับ .NET บนระบบของคุณ:
- ติดตั้ง NuGet Package โดยใช้ NuGet Package Manager GUI
- ติดตั้ง NuGet Package โดยใช้ Package Manager Console คุณสามารถใช้คำสั่งต่อไปนี้
PM> Install-Package Aspose.Html
- ติดตั้ง Aspose.HTML สำหรับ .NET ผ่าน MSI
ไลบรารีนี้รองรับการแยกวิเคราะห์ HTML5, CSS3, SVG และ HTML Canvas เพื่อสร้าง Document Object Model (DOM) ตามมาตรฐาน WHATWG DOM Aspose.HTML สำหรับ .NET เขียนขึ้นอย่างสมบูรณ์ในภาษา C# และสามารถใช้สร้างแอปพลิเคชัน .NET แบบ 32 บิตหรือ 64 บิตประเภทใดก็ได้ รวมถึง ASP.NET, WCF, WinForms & .NET Core ก่อนเรียกใช้โค้ดตัวอย่างการแปลง .NET ตรวจสอบให้แน่ใจว่าคุณมีระบบปฏิบัติการ เช่น Microsoft Windows หรือเข้ากันได้กับ .NET Framework หรือ .NET Standard และสภาพแวดล้อมการพัฒนา เช่น Microsoft Visual Studio สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการติดตั้งไลบรารี C# และข้อกำหนดของระบบ โปรดดูที่ เอกสาร Aspose.HTML