이 소프트웨어 라이브러리는 Python 개발자에게 DOC 파일을 여러 부분으로 분할하는 기능 세트를 제공합니다. DOC 문서를 별도의 파일로 분할하면 문서 섹션을 병렬로 작업하는 것이 더 쉬워집니다. 예를 들어 여러 사람이 하나의 DOC 문서를 동시에 작업하는 경우 문서를 분할하면 작업 속도를 높일 수 있습니다. DOC 문서 분할은 DOC 파일에서 텍스트를 추출하고 데이터를 자동화된 정보 시스템 또는 데이터베이스에 통합하는 기술의 일부일 수 있습니다.
우리 라이브러리는 Python 개발자에게 DOC 파일을 여러 부분으로 분할하고 지정된 모드에 따라 페이지를 추출하는 데 필요한 모든 기능을 제공합니다. 이는 Microsoft Word, Acrobat Reader 또는 기타 응용 프로그램을 설치할 필요가 없는 독립형 Python via .NET 솔루션입니다.
Python 코드에서 다양한 기준을 사용하여 DOC 콘텐츠를 분할합니다. DOC 문서에는 '제목별 분할', '섹션별 분할', '페이지별 분할', '페이지 범위별 분할' 등의 페이지 추출 모드를 사용할 수 있습니다.
DOC 파일을 여러 부분으로 분할한 후 'Document.Save' 메서드를 사용하여 결과를 필요한 파일 형식으로 내보낼 수 있습니다. 출력 스트림을 리디렉션할 수 있는 'DocumentPartSavingCallback' 속성을 사용하여 DOC 문서 부분을 HTML 또는 EPUB로 내보내는 방법을 제어할 수도 있습니다.
Python via .NET 용 솔루션을 사용하여 DOC 문서를 쉽게 분할하세요. 다음 예에서는 Python 을 사용하여 DOC 문서를 분할하는 방법을 보여줍니다.
pip install aspose-words
복사
import aspose.words as aw
doc = aw.Document("Input.doc")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.doc")
이 패키지는 Python ≥3.5 및 <3.12 와 호환됩니다. Linux용 소프트웨어를 개발하는 경우 제품 설명서 에서 gcc 및 libpython 에 대한 추가 요구 사항을 살펴보십시오.