이 소프트웨어 라이브러리는 Python 개발자에게 Word, PDF, EPUB, HTML, DOCX 문서를 부분으로 분할하는 기능 세트를 제공합니다. 텍스트를 별도의 파일로 분할하면 문서 섹션으로 더 쉽게 작업할 수 있습니다. 문서 분할 절차는 데이터를 자동화된 정보 시스템 또는 데이터베이스에 통합하는 기술의 일부일 수 있습니다.
우리 라이브러리는 Python 개발자에게 문서에 필요한 모든 기능을 제공하고 지정된 모드에 따라 문서 페이지를 추출합니다. 이것은 Microsoft Word, Acrobat Reader 또는 기타 응용 프로그램을 설치할 필요가 없는 독립 실행형 Python via .NET 솔루션입니다.
Python 코드에서 다른 기준을 사용하여 문서 내용을 분할합니다. '제목으로 분할', '섹션으로 분할', '페이지별로 분할', '페이지 범위별로 분할'과 같은 페이지 추출 모드를 사용할 수 있습니다.
문서를 분할한 후 'Document.Save' 메소드를 사용하여 필요한 파일 형식으로 결과를 내보낼 수 있습니다. 출력 스트림을 리디렉션할 수 있는 'DocumentPartSavingCallback' 속성을 사용하여 문서 부분을 HTML 또는 EPUB 형식으로 내보내는 방법을 제어할 수도 있습니다.
Python via .NET 용 솔루션으로 문서를 쉽게 분할하세요. 다음 예는 Python:
pip install aspose-words
복사
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
이 패키지는 Python ≥3.5 및 <3.12 와 호환됩니다. Linux용 소프트웨어를 개발하는 경우 제품 설명서 에서 gcc 및 libpython 에 대한 추가 요구 사항을 살펴보십시오.