Aspose.HTML for Java는 Java 애플리케이션 내에서 HTML을 조작하고 생성하는 고급 HTML 조작 API입니다. API를 사용하면 노드를 추가, 삭제, 교체하고 CSS를 추출하고 여러 방법으로 문서를 탐색할 수 있습니다. 또한 API는 EPUB 및 MHTML을 로드하는 기능과 JavaScript를 통해 DOM을 조작할 수 있는 스크립팅을 제공합니다.
Aspose.HTML for Java는 파일 간 형식 변환을 지원하여 HTML 문서를 로드하고 출력을 XPS, PDF 및 JPEG, PNG, BMP 등을 포함한 래스터 이미지로 저장하고 PDF 파일에 대한 암호화를 제공합니다.

고급 Java HTML 처리 API 기능

 

설명서의 API 기능

문서에서 Aspose.HTML 기능의 전체 목록을 볼 수 있습니다. 프로젝트에서 Aspose.HTML for Java 라이브러리를 사용하면 다음 작업을 수행할 수 있습니다.

  • 다른 소스 에서 기존 HTML 문서를 생성하거나 엽니다.
  • HTML 조작: API를 통해 HTML 노드 생성, 편집, 제거 및 교체.
  • HTML 문서를 저장합니다.
  • 특정 HTML 노드에 대한 CSS 스타일 추출.
  • HTML 문서 처리에 영향을 미치는 문서 샌드박스 구성.
  • 다양한 방법으로 HTML 문서를 탐색합니다.
  • HTML 문서를 지원되는 다양한 형식(JPEG, PNG, BMP, TIFF, PDF, XPS 등)으로 변환합니다.

HTML을 PDF 및 XPS 형식으로 변환

API는 BMP, TIFF, JPEG, PNG, PDF 및 XPS 형식을 포함하여 가장 일반적으로 사용되는 래스터 이미지에 대한 HTML 렌더링을 지원합니다. 개발자는 렌더링할 페이지 번호, 결과 페이지 크기 또는 포함된 이미지에 대한 JPEG 압축 설정을 포함하여 결과 고정 레이아웃 형식에 대해 PageSetup 측면을 구성하여 사용자 지정할 수 있습니다.

HTML을 고정 레이아웃 형식으로 렌더링 – Java


// Load HTML document from file
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();

renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);

래스터 이미지로 변환

Aspose.HTML for Java는 HTML 페이지를 추가 소프트웨어나 도구 없이 TIFF, BMP, PNG 및 JPEG를 포함하여 가장 일반적으로 사용되는 래스터 이미지 형식으로 변환할 수 있는 고성능 렌더링 엔진을 핵심으로 제공합니다.

Aspose.HTML for Java를 사용하여 HTML을 PNG로 변환


// Initialize an HTML document from a file
HTMLDocument document = new HTMLDocument("document.html");

// Initialize ImageSaveOptions
ImageSaveOptions options = new ImageSaveOptions(ImageFormat.Png);

// Convert HTML to PNG
Converter.convertHTML(document, options, "document-output.png");

온라인 HTML 변환기를 사용해 볼 수 있습니다.

또한 HTML, XHTML, MHTML, Markdown, EPUB 또는 SVG를 아래 나열된 몇 가지를 포함하여 다른 많은 파일 형식으로 변환할 수 있습니다.


EPUB 및 MHTML 파일 조작

라이브러리는 EPUB 및 MHTML 파일을 로드하여 고정 레이아웃 및 래스터 이미지 형식으로의 변환을 비롯한 다양한 작업을 수행할 수 있습니다.

Aspose.HTML for Java를 사용하여 MHTML을 PDF로 변환


// Open an existing MHTML file for reading
java.io.FileInputStream fileInputStream = new java.io.FileInputStream("sample.mht");

// Create an instance of the PdfSaveOptions class
PdfSaveOptions options = new PdfSaveOptions();

// Call the convertMHTML() method to convert MHTML to PDF
Converter.convertMHTML(fileInputStream, options, "sample-output.pdf");

HTML 노드 탐색

API는 XPath, 요소 또는 CSS 선택기 쿼리를 통해 HTML 파일을 통한 탐색을 지원하며 노드를 쉽게 삽입, 추출, 제거 또는 교체할 수 있습니다.

앵커 유형의 모든 노드 추출 – Java


// Instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

// Get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

// Display anchor text & href values for all nodes
for (Node node : nodelist){

    HTMLAnchorElement anchor = (HTMLAnchorElement)node;
    System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}

샌드박스 구성

HTML API를 사용하면 HTML 문서 처리에 영향을 주는 문서 샌드박스를 구성할 수 있습니다. 경우에 따라 CSS 스타일은 화면 크기에 따라 다릅니다.

Java를 사용하여 HTML에서 PDF로 변환 시 스크립트 비활성화


// Prepare HTML code and save it to a file
String code = "Hello, World!!\n" +
        "\n";

try (java.io.FileWriter fileWriter = new java.io.FileWriter("sandboxing.html")) {
    fileWriter.write(code);
}

// Create an instance of the Configuration class
Configuration configuration = new Configuration();

// Mark 'scripts' as an untrusted resource
configuration.setSecurity(com.aspose.html.Sandbox.Scripts);

// Initialize an HTML document with specified configuration
HTMLDocument document = new HTMLDocument("sandboxing.html", configuration);

// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "sandboxing_out.pdf");

FAQ

1. Aspose.HTML for Java란 무엇인가요?

Aspose.HTML for Java는 개발자가 외부 도구나 소프트웨어 없이 Java 애플리케이션 내에서 HTML 문서를 조작하고 변환할 수 있도록 해주는 클래스 라이브러리입니다.

2. Aspose.HTML for Java는 API 수준에서 어떤 문제를 해결하나요?

Aspose.HTML for Java는 브라우저 런타임에 의존하지 않고 HTML 문서를 로드, 파싱, 수정, 렌더링 및 변환할 수 있는 프로그래밍 가능한 HTML 처리 엔진을 제공합니다. 구조화된 DOM, 렌더링 파이프라인 및 변환 계층에 Java API를 통해 직접 접근할 수 있어 동작이 결정적이며 백엔드 시스템에 적합합니다.

3. HTML은 내부적으로 어떻게 파싱되며 최신 표준을 준수하나요?

파서는 WHATWG 및 W3C 사양을 따르며, 잘못된 마크업, 암시적 태그, 인코딩 규칙을 최신 웹 표준에 따라 처리합니다. 생성된 문서는 완전히 탐색 가능한 DOM으로 제공되며, 변환, 검증 및 렌더링 작업에 중요합니다.

4. API를 사용하여 HTML에서 구조화된 데이터를 추출할 수 있나요?

네. 문서는 완전한 DOM으로 표현되므로 셀렉터 또는 트래버설 API를 사용하여 특정 요소, 속성 또는 텍스트 노드를 조회할 수 있습니다. 이는 HTML이 단순한 시각적 문서가 아니라 데이터 컨테이너로 사용될 때 특히 유용합니다.

5. API는 HTML 외의 형식도 지원하나요?

네, 하지만 모든 형식이 동일하게 처리되는 것은 아닙니다. Aspose.HTML for Java는 XHTML, MHTML, SVG, EPUB, Markdown과 같은 형식을 로드하고 처리할 수 있지만, 모든 형식이 동일한 HTML 문서처럼 다뤄지는 것은 아닙니다. 일부 형식은 특정 로딩 메서드가 필요하거나 전체 편집이 아닌 변환과 같은 제한된 작업만 지원됩니다.
실제로 HTML은 주요 작업 형식이며, 다른 형식은 동일한 처리 파이프라인 내에서 입력 소스 또는 변환 대상으로 사용되는 경우가 많습니다.




  

Support and Learning Resources

  
  

Aspose.HTML은 아래 나열된 다른 인기 있는 개발 환경을 위한 개별 HTML 처리 API를 제공합니다.