HTML을 Python의 부분으로 분할

주어진 기준에 따라 하나의 HTML 파일을 더 작은 파일 그룹으로 분할하는 빠른 Python 라이브러리

Python via .NET 라이브러리를 사용하여 HTML 파일을 부분으로 분할합니다. 추출된 HTML 페이지를 다른 데이터와 통합할 수 있으며 결과적으로 필요한 형식과 콘텐츠의 문서를 얻을 수 있습니다. HTML을(를) 여러 부분으로 나누면 HTML 파일에 대한 공동작업이 더 쉬워집니다.

코드 스니펫 보기

Python 을 사용하여 HTML 분할

이 소프트웨어 라이브러리는 Python 개발자에게 HTML 파일을 여러 부분으로 분할하는 기능 세트를 제공합니다. HTML 를 별도의 파일로 분할하면 문서 섹션을 병렬로 작업하는 것이 더 쉬워집니다. 예를 들어 여러 사람이 하나의 HTML 를 동시에 작업하는 경우 HTML 를 분할하면 작업 속도를 높일 수 있습니다. HTML 분할은 HTML 파일에서 텍스트를 추출하고 데이터를 자동화된 정보 시스템 또는 데이터베이스에 통합하는 기술의 일부일 수 있습니다.

우리 라이브러리는 Python 개발자에게 HTML 를 여러 부분으로 분할하고 지정된 모드에 따라 페이지를 추출하는 데 필요한 모든 기능을 제공합니다. 이는 Microsoft Word, Acrobat Reader 또는 기타 응용 프로그램을 설치할 필요가 없는 독립형 Python via .NET 솔루션입니다.

HTML 파일을 Python 코드의 여러 부분으로 분할합니다.

Python 코드에서 다양한 기준을 사용하여 HTML 콘텐츠를 분할합니다. HTML 파일에 대해 '제목별 분할', '섹션별 분할', '페이지별 분할', '페이지 범위별 분할'과 같은 페이지 추출 모드를 사용할 수 있습니다.

HTML 파일을 여러 부분으로 분할한 후 'Document.Save' 메서드를 사용하여 결과를 필요한 파일 형식으로 내보낼 수 있습니다. 출력 스트림을 리디렉션할 수 있는 'DocumentPartSavingCallback' 속성을 사용하여 HTML 부분을 HTML 또는 EPUB로 내보내는 방법을 제어할 수도 있습니다.

Python via .NET 용 솔루션을 사용하여 문서 HTML 를 쉽게 분할하세요. 다음 예에서는 Python 을 사용하여 HTML 를 분할하는 방법을 보여줍니다.

HTML 파일을 분할하는 Python 코드 예
분할하려는 파일 업로드
코드 실행
목록에서 대상 형식 선택
pip install aspose-words
복사
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
코드 실행

Python에서 HTML을(를) 분할하는 방법

  1. 프로그래밍 방식으로 HTML 파일을 분할하려면 Python 라이브러리를 설치하세요.
  2. Python 프로젝트에 라이브러리 참조를 추가합니다(라이브러리 가져오기).
  3. Python에서 HTML을(를) 엽니다.
  4. extract_pages() 메서드를 호출하여 HTML에서 특정 페이지를 추출합니다.
  5. HTML 분할 결과를 별도의 파일로 가져옵니다.

HTML 문서를 분할하는 Python 라이브러리

우리 는 PyPi Python 패키지를 호스팅합니다. "Aspose.Words for Python via .NET" 개발자 환경에 설치하는 방법에 대한 단계별 지침 을 따르십시오.

시스템 요구 사항

이 패키지는 Python ≥3.5 및 <3.12 와 호환됩니다. Linux용 소프트웨어를 개발하는 경우 제품 설명서 에서 gcc 및 libpython 에 대한 추가 요구 사항을 살펴보십시오.

기타 지원되는 HTML 분할 작업

HTML을 다른 파일 형식으로 분할할 수도 있습니다.

5%

Aspose 제품 업데이트 구독

월간 뉴스레터와 제안을 우편함으로 직접 받으십시오.

© Aspose Pty Ltd 2001-2024. 판권 소유.