Python을 사용하여 DOCX를 MHTML로 변환
Microsoft Word®를 설치하지 않고도 Python 응용 프로그램에서 DOCX에서 MHTML, HtmlFixed 및 HTML로 변환합니다.
DOCX를 MHTML(웹 아카이브 형식)로 변환 기능 또는 HtmlFixed에 추가하려는 Python 개발자의 경우 애플리케이션 내에서 절대적으로 배치된 요소를 사용하여 문서를 HTML 형식으로 저장하려고 합니다. Aspose.Total for Python via .NET API는 변환 프로세스를 자동화하는 데 도움이 될 수 있습니다. 다양한 형식을 처리하는 다양한 API의 전체 패키지입니다.
Aspose.Total for Python via .NET 패키지의 일부인 Aspose.Words for Python via .NET API를 사용하여 DOCX를 MHTML로 변환 기능을 추가합니다. DOCX 파일이 간단한 경우 두 줄의 코드만 있으면 됩니다. DOCX 파일을 로드하고 MHTML 또는 HTML_FIXED로 SaveFormat 열거와 함께 적절한 파일 경로로 save 메소드를 호출하십시오. 그러나 문서 모델을 원본에 가깝게 복원해야 하는 경우 결과 문서 내에 왕복 정보라는 추가 정보를 저장할 필요가 있습니다.
어떻게 Python에서 DOCX를 MHTML로 변환
- Document 클래스를 사용하여 소스 DOCX 파일 로드
- HtmlSaveOptions 의 인스턴스를 만듭니다.
- export_roundtrip_information를 True로 설정
- SaveFormat 을 MHTML로 지정
- 출력 파일 경로 및 SaveFormat을 매개변수로 지정하면서
save
메소드를 호출하십시오. 따라서 DOCX 파일은 지정된 경로에서 MHTML로 변환됩니다.
변환 요구 사항
- DOCX를 MHTML 또는 HtmlFixed 형식으로 변환하려면 Python 3.5 이상이 필요합니다.
- PyPI( Aspose.Words )에서 직접 프로젝트 내 참조 API
- 또는 다음 pip 명령
pip install aspose.words
를 사용합니다. - 또한 Microsoft Windows 또는 Linux 기반 OS( Words 에 대한 자세한 내용 참조) 및 Linux의 경우 gcc 및 libpython에 대한 추가 요구 사항을 확인하고 단계별 지침 INSTALL 을 따릅니다.
Python에서 DOCX를 MHTML로 저장 - 단순
import aspose.words as aw | |
doc = aw.Document(dataDir + "MicrosoftWordSimpleFile.docx") | |
doc.save(dataDir + "output.mhtml", aw.SaveFormat.MHTML) |
Python에서 DOCX에서 MHTML로 변환
import aspose.words as aw | |
doc = aw.Document(dataDir + "sourcefile.docx") | |
saveOptions = aw.saving.HtmlSaveOptions() | |
saveOptions.save_format = aw.SaveFormat.MHTML | |
saveOptions.export_roundtrip_information = True | |
saveOptions.export_fonts_as_base64 = True | |
doc.save(dataDir + "wordto.mhtml", saveOptions) |