C#에서 HTML을 로드하는 방법

HTML 로딩은 웹 개발, 웹 페이지 렌더링, 데이터 추출, 콘텐츠 관리, 문서 처리, 테스트 등을 포함한 다양한 웹 작업의 기본 작업입니다. .NET용 Aspose.HTML 라이브러리는 HTMLDocument를 초기화하기 위해 HTMLDocument() 생성자 집합을 구현하는 HTMLDocument 클래스를 제공합니다. HTML 문서는 파일이나 URL에서 로드할 수 있고 문자열이나 메모리 스트림에서 생성하고 로드할 수 있습니다. 그럼 HTML을 로드하는 방법을 살펴보겠습니다!

먼저 프로젝트에 .NET용 Aspose.HTML이 설치되어 있는지 확인하세요. 이 라이브러리의 설치 과정은 비교적 간단합니다. 다음 명령을 사용하여 NuGet 패키지 관리자 콘솔을 통해 설치할 수 있습니다.


.NET용 Aspose.HTML 설치

Install-Package Aspose.HTML

파일에서 HTML 로드

파일에서 HTML을 로드하는 것은 기존 HTML 파일, 템플릿 또는 HTML 형식으로 저장된 데이터로 작업하기 위한 좋은 시작점입니다. 파일에서 기존 HTML 파일을 로드하고, 작업하고, 저장해야 하는 경우 다음 코드 조각이 도움이 될 것입니다.

  1. 주소(로컬 문서 경로)에서 HTML 문서를 로드하는 HTMLDocument(address) 생성자를 사용하여 파일에서 HTML 문서를 로드합니다.
  2. Save() 메서드를 사용하여 HTML 파일을 저장합니다.

.NET 라이브러리용 Aspose.HTML은 파일에서 HTML 문서를 로드할 수 있는 생성자 세트를 제공합니다. 예를 들어 HTMLDocument(address, configuration) 은 지정된 환경 구성 설정이 있는 주소에서 HTML 문서를 로드합니다. 자세한 내용은 API 참조 HTMLDocument 장을 참조하세요.


파일에서 HTML을 로드하는 C# 코드

using System.IO;
using Aspose.Html;
...

    // Prepare a file path
	string documentPath = Path.Combine(DataDir, "sprite.html");

	// Initialize an HTML document from the file
	using (var document = new HTMLDocument(documentPath))
	{
		// Work with the document

		// Save the document to a disk
		document.Save(Path.Combine(OutputDir, "sprite_out.html"));
	}

URL에서 HTML 로드

URL에서 HTML을 로드하는 것은 웹 페이지에서 정보를 추출해야 할 때 유용할 수 있습니다. URL에서 직접 HTML을 로드할 수 있습니다.

  1. HTMLDocument(Url) 생성자를 사용하여 URL에서 HTML 문서를 로드합니다. 지정된 환경 구성 설정이 있는 URL에서 HTML을 로드하려는 경우 HTMLDocument(Url, configuration) 를 사용할 수 있습니다.
  2. OuterHTM 속성을 사용하여 문서의 전체 HTML 콘텐츠를 가져옵니다. 여기에는 HTML 요소 자체를 포함하여 전체 문서의 HTML이 포함됩니다.

로컬 드라이브에 HTML 문서를 저장해야 하는 경우 Save() 메서드를 사용하세요.


URL에서 HTML을 로드하는 C# 코드

using System.IO;
using Aspose.Html;
...

	// Load a document from 'https://docs.aspose.com/html/net/creating-a-document/' web page
	using (var document = new HTMLDocument("https://docs.aspose.com/html/net/creating-a-document/"))
	{
		var html = document.DocumentElement.OuterHTML;

		// Write the document content to the output stream
		Console.WriteLine(html);
	}

문자열에서 HTML 로드

문자열에서 HTML을 로드하는 것은 HTML 콘텐츠를 조작하고 구조화되지 않은 HTML 문자열을 조작, 구문 분석 또는 표시할 수 있는 구조화된 문서로 변환할 수 있게 해주는 중요한 기능입니다.

  1. 먼저 HTML 문서용 코드를 준비합니다.
  2. HTMLDocument(content, baseUri) 생성자를 사용하여 지정된 baseUri가 있는 문자열 콘텐츠에서 HTML 문서를 초기화합니다.
  3. Save() 메서드를 사용하여 HTML 파일을 저장합니다.

문자열에서 HTML을 로드하는 C# 코드

using System.IO;
using Aspose.Html;
...

	// Prepare HTML code
    var html_code = "<p>Learn how to load HTML</p>";

    // Initialize a document from the string variable
    using (var document = new HTMLDocument(html_code, "."))
    {
        // Save the document to a disk
        document.Save(Path.Combine(OutputDir, "load-html-from-string.html"));
    }

메모리 스트림에서 HTML 로드

스트림에서 HTML을 로드하는 것은 메모리 효율성이나 메모리 내 데이터 작업에 유용합니다. 다음 C# 코드는 MemoryStream에서 HTML을 로드하고 .NET용 Aspose.HTML을 사용하여 파일에 저장하는 방법을 보여줍니다.

  1. ‘MemoryStream’ 및 ‘StreamWriter’의 개체를 초기화합니다. StreamWriter는 HTML 코드를 MemoryStream에 쓰는 데 사용됩니다.
  2. Write() 메소드를 사용하여 HTML 코드를 MemoryStream에 작성합니다.
  3. ‘Flush()‘를 호출하여 버퍼링된 데이터가 스트림에 기록되었는지 확인하고, ‘Seek(0, SeekOrigin.Begin)‘을 사용하여 스트림 위치를 시작으로 설정합니다. HTMLDocument는 스트림 내의 현재 위치에서 콘텐츠를 읽기 때문에 이는 중요합니다.
  4. HTMLDocument(content, baseUri) 생성자를 사용하여 MemoryStream에서 HTMLDocument를 초기화합니다. HTMLDocument의 인스턴스는 MemoryStream 개체와 baseUri를 매개 변수로 전달하여 생성됩니다.
  5. Save() 메서드를 사용하여 HTML 파일을 로컬 드라이브에 저장합니다.

메모리 스트림에서 HTML을 로드하는 C# 코드

using System.IO;
using Aspose.Html;
...

    // Create a memory stream object
	using (var mem = new MemoryStream())
	using (var sw = new StreamWriter(mem))
	{
		// Write the HTML code into the memory object
		sw.Write("<p>Load HTML from a memory stream</p>");

		// It is important to set the position to the beginning, since HTMLDocument starts the reading exactly from the current position within the stream
		sw.Flush();
		mem.Seek(0, SeekOrigin.Begin);

		// Initialize a document from the string variable
		using (var document = new HTMLDocument(mem, "."))
		{
			// Save the document to a local disk
			document.Save(Path.Combine(OutputDir, "load-html-from-stream.html"));
		}
	}

Aspose.HTML API에 대해 자세히 알아보려면 문서 가이드를 참조하세요. Create HTML Document 문서에서는 파일, URL 및 스트림에서 문서를 로드하거나 처음부터 문서를 만드는 방법에 대한 정보를 찾을 수 있습니다. Edit HTML Document 문서 문서에서는 .NET API용 Aspose.HTML을 사용하여 문서 개체 모델을 읽거나 편집하는 방법에 대한 기본 정보를 제공합니다. HTML 요소를 생성하는 방법과 이를 사용하여 작업하는 방법(새 노드를 삽입하거나 기존 노드의 내용을 제거 또는 편집하여 문서 수정)을 살펴봅니다.