Aspose.Total for Java 를 사용하면 2단계 프로세스로 Java 애플리케이션에서 MHTML을 TXT로 변환 기능을 통합할 수 있습니다. 먼저 Aspose.PDF for Java 를 사용하여 MHTML을 XLSX로 렌더링할 수 있습니다. 두 번째 단계에서는 Spreadsheet Programming API Aspose.Cells for Java 를 사용하여 XLSX를 TXT로 변환할 수 있습니다.
Java를 통해 MHTML 파일을 TXT로 변환
변환 요구 사항
Maven 기반 프로젝트에서 직접 Java용 Aspose.Total을 쉽게 사용할 수 있습니다. Java용 Aspose.PDF 및 Java용 Aspose.Cells pom.xml에 있습니다.
변환 요구 사항
MHTML 문서가 비밀번호로 보호되어 있는 경우 비밀번호 없이 TXT로 변환할 수 없습니다. API를 사용하면 먼저 유효한 암호를 사용하여 보호된 문서를 열고 그 후에 변환할 수 있습니다. 암호화된 파일을 열기 위해 문서 클래스를 생성하고 파일 이름과 비밀번호를 인수로 전달합니다.
Java를 통해 보호된 MHTML을 TXT로 변환
MHTML 파일을 TXT로 변환하는 동안 출력 TXT 파일 형식에 워터마크를 추가할 수도 있습니다. 워터마크를 추가하려면 새 통합 문서를 만들어 변환된 XLSX 파일을 엽니다. 인덱스를 통해 워크시트를 선택하고 모양을 만들고 addTextEffect 기능을 사용하여 색상, 투명도 등을 설정합니다. 그런 다음 워터마크를 사용하여 XLSX 문서를 TXT로 저장할 수 있습니다.
주요 사용 사례
오프라인에서 일반 텍스트로 웹 콘텐츠를 아카이빙하여 읽기.
MHTML 페이지에서 텍스트 보고서 추출하여 분석.
온라인 기사 또는 자습서를 빠르게 참조하기 위해 TXT로 변환.
텍스트 기반 처리, NLP 또는 AI 도구에 대비한 콘텐츠 준비.
자동화 시나리오
대규모 웹 아카이빙을 위한 일괄 MHTML에서 TXT로 변환.
분석을 위해 웹 페이지에서 텍스트 데이터를 예약 추출.
자동화된 텍스트 처리를 위한 AI/ML 파이프라인 통합.
실시간 웹 콘텐츠 모니터링 및 보고를 위한 트리거 변환.