웹 사이트에서 프로그래밍 방식으로 SVG 추출
HTML에서 이미지를 추출하는 기능은 웹 스크래핑 및 콘텐츠 분석과 같은 다양한 애플리케이션에 중요합니다. Aspose.HTML for Java 은 개발자가 HTML 문서에서 정보를 원활하게 탐색하고 수집할 수 있는 일련의 도구를 제공하여 이 프로세스를 간소화하는 강력한 라이브러리입니다. 웹 사이트에서 외부 SVG 이미지를 추출하는 방법을 살펴보겠습니다.
Java를 사용하여 HTML에서 SVG 추출하기
Aspose.HTML for Java 라이브러리를 사용하면 HTML 문서에서 데이터를 구문 분석하고 추출하기 위한 강력한 도구 세트를 사용하여 나만의 애플리케이션을 빠르게 구축할 수 있습니다. 아래 예시는 몇 줄의 Java 코드만으로 HTML 문서에서 모든 외부 SVG를 추출하는 방법을 보여줍니다.
웹사이트에서 SVG를 추출하는 자바 코드
// Open a document you want to download external SVGs from
final HTMLDocument document = new HTMLDocument("https://products.aspose.com/html/net/");
// Collect all <img> elements
HTMLCollection images = document.getElementsByTagName("img");
// Create a distinct collection of relative image URLs
java.util.Set<String> urls = new HashSet<>();
for (Element element : images) {
urls.add(element.getAttribute("src"));
}
// Filter out non SVG images
java.util.List<String> svgUrls = new ArrayList<>();
for (String url : urls) {
if (url.endsWith(".svg")) {
svgUrls.add(url);
}
}
// Create absolute SVG image URLs
java.util.List<Url> absUrls = svgUrls.stream()
.map(src -> new Url(src, document.getBaseURI()))
.collect(Collectors.toList());
for (Url url : absUrls) {
// Create a downloading request
final RequestMessage request = new RequestMessage(url);
// Download SVG image
final ResponseMessage response = document.getContext().getNetwork().send(request);
// Check whether response is successful
if (response.isSuccess()) {
String[] split = url.getPathname().split("/");
String path = split[split.length - 1];
// Save file to a local file system
FileHelper.writeAllBytes(path, response.getContent().readAsByteArray());
}
}
HTML에서 SVG를 추출하는 단계
- HTMLDocument(
Url
) 생성자를 사용하여 HTMLDocument 클래스의 인스턴스를 생성하고 외부 SVG 이미지를 추출할 웹사이트의 URL을 전달합니다. - 모든
<img>
요소를 수집하려면 getElementsByTagName("img"
) 메서드를 사용합니다. - getAttribute(
"src"
) 메서드를 사용하여 각 이미지 요소에서src
속성을 추출하고 관련 이미지 URL의 고유한 컬렉션을 만듭니다. - 각 URL이
.svg
로 끝나는지 확인하여 SVG 이미지 URL만 필터링하고 새 목록에 추가합니다. - Url 클래스와 HTMLDocument 클래스의 BaseURI 속성을 사용하여 절대 이미지 URL을 생성합니다.
- 각 절대 URL에 대해
RequestMessage(
url
) 생성자를 사용하여 요청을 생성합니다. 각 요청을 전송하고 성공 여부를 응답에서 확인합니다. - 응답이 성공하면
FileHelper.writeAllBytes()
를 사용하여 SVG 콘텐츠를 로컬 파일 시스템에 저장합니다.
Aspose.HTML for Java을 사용하면 웹 페이지를 파싱하고, SVG 이미지 소스를 식별하고, SVG를 다운로드하는 도구를 쉽게 만들 수 있습니다. 분석, 보관 또는 콘텐츠 제작을 위해 SVG를 수집해야 하는 사람들을 위한 강력한 솔루션으로, 수작업의 번거로움 없이 간편하게 사용할 수 있습니다. Java를 사용하여 웹사이트에서 다양한 유형(인라인 및 외부)의 SVG를 프로그래밍 방식으로 추출하는 방법에 대해 자세히 알아보려면 Java로 웹사이트에서 SVG 추출하기 문서 문서를 참조하세요.
**참고:**저장된 이미지를 상업적 목적으로 사용하기 전에 저작권법을 준수하고 적절한 권한 또는 라이선스를 취득하는 것이 중요합니다. 당사는 타인의 파일을 동의 없이 상업적 목적으로 추출하여 사용하는 것을 지원하지 않습니다.
Java HTML 파서 라이브러리 시작하기
HTML API는 고급 웹 스크래핑 및 HTML 구문 분석 라이브러리입니다. 노드를 생성, 편집, 탐색하고 데이터를 추출하고 HTML, XHTML 및 MHTML 파일을 PDF, 이미지 및 기타 형식으로 변환할 수 있습니다. 또한 CSS, HTML Canvas, SVG, XPath 및 JavaScript를 기본적으로 처리하여 조작 작업을 확장합니다. 독립형 API이며 소프트웨어 설치가 필요하지 않습니다.
Aspose Maven Repository 에서 직접 최신 버전을 다운로드하고 pom.xml에 다음 구성을 추가하여 Maven 기반 프로젝트에 설치할 수 있습니다.
저장소
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
의존
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>version of aspose-html API</version>
<classifier>jdk17</classifier>
</dependency>
기타 지원되는 기능
Aspose.HTML for Java 라이브러리를 사용해 HTML 기반 문서를 파싱하고 조작하세요. 명확하고 안전하며 간단합니다!