Al utilizar Aspose.Total for Java , puede integrar la función de conversión de MHTML a TXT en sus aplicaciones Java en un proceso de dos pasos. En primer lugar, al usar Aspose.PDF for Java puede renderizar MHTML a XLSX. En el segundo paso, puede convertir XLSX a TXT utilizando la API de programación de hojas de cálculo Aspose.Cells for Java .
Convertir archivo MHTML a TXT a través de Java
- Abra el archivo MHTML usando la clase Document
- Convierta MHTML a XLSX usando SaveOptions método
- Cargue el documento XLSX usando la clase Workbook
- Guarde el documento en formato TXT usando save método
Requisitos de conversión
Puede usar fácilmente Aspose.Total para Java directamente desde un proyecto basado en Maven df/java/installation/) y Aspose.Cells for Java en su pom.xml.
Requisitos de conversión
Si su documento MHTML está protegido con contraseña, no puede convertirlo a TXT sin la contraseña. Con la API, primero puede abrir el documento protegido con una contraseña válida y convertirlo después. Para abrir el archivo cifrado, puede inicializar una nueva instancia del Document class y pase el nombre de archivo y la contraseña como argumentos.
Convierta MHTML protegido a TXT a través de Java
Al convertir un archivo MHTML a TXT, también puede agregar una marca de agua a su formato de archivo TXT de salida. Para agregar una marca de agua, cree un nuevo libro de trabajo para abrir el archivo XLSX convertido. Seleccione Hoja de trabajo a través de su índice, cree una Forma y use su función addTextEffect, establezca colores, transparencia y más. Después de eso, puede guardar su documento XLSX como TXT con marca de agua.
Casos de uso clave
Archivar contenido web como texto plano para lectura sin conexión.
Extraer informes textuales de páginas MHTML para análisis.
Convertir artículos en línea o tutoriales en TXT para referencia rápida.
Preparar contenido para procesamiento basado en texto, NLP o herramientas de IA.
Escenarios de automatización
Conversión por lotes de MHTML a TXT para archivado web a gran escala.
Extracción programada de datos textuales de páginas web para análisis.
Integración con tuberías de IA/ML para procesamiento automático de texto.
Conversión activada para monitoreo y reporte de contenido web en tiempo real.