Para un desarrollador de Python, que está tratando de agregar una función de conversión de PDF a MHTML (formato de archivo web) o HtmlFixed significa que desea guardar el documento en formato HTML utilizando elementos absolutamente posicionados dentro de la aplicación. La API Aspose.Total for Python via .NET puede ayudar a automatizar el proceso de conversión. Es un paquete completo de varias API que se ocupan de diferentes formatos.
Usamos la API Aspose.Words for Python via .NET que forma parte del paquete Aspose.Total for Python via .NET para agregar la función de conversión de PDF a MHTML. En caso de que el archivo PDF sea simple, son solo dos líneas de código. Cargue el archivo PDF y llame al método de guardado con la ruta de archivo adecuada junto con la enumeración SaveFormat como MHTML o HTML_FIXED. Pero en caso de que sea necesario restaurar el modelo del documento lo más cerca posible del original, entonces es necesario guardar información adicional dentro del documento resultante llamado información de ida y vuelta.
Cómo Convertir PDF a MHTML en Python
- Cargue el archivo PDF de origen usando la clase Document
- Cree la instancia de HtmlSaveOptions
- Establezca export_roundtrip_information como Verdadero
- Especifique SaveFormat como MHTML
- Llame al método
save
mientras especifica la ruta del archivo de salida y SaveFormat como parámetros. Entonces su archivo PDF se convierte a MHTML en la ruta especificada.
Requisitos de conversión
- Para la conversión de formato PDF a MHTML o HtmlFixed, se requiere Python 3.5 o posterior
- API de referencia dentro del proyecto directamente desde PyPI ( Aspose.Words )
- O use los siguientes comandos pip
pip install aspose.words
- Además, el sistema operativo basado en Microsoft Windows o Linux (ver más para Words ) y para Linux verifique los requisitos adicionales para gcc y libpython y siga las instrucciones paso a paso INSTALL