Convierta PDF en HTML mediante Python

Conversión de PDF a HTML en Python. Los programadores pueden usar este código de ejemplo para exportar PDF a HTML dentro de cualquier .NET Framework, .NET Core y PHP, VBScript, Delphi o C++ mediante COM Interop.

Convierte PDF a HTML en Python for .NET

¿Cómo convertir PDF a HTML? Puedes convertir fácilmente mediante programación un documento del formato PDF al formato HTML con una moderna API de Python de procesamiento de documentos. Use solo unas pocas líneas de código para convertir archivos con alta calidad. La biblioteca Aspose.PDF permitirá a cualquier desarrollador resolver fácilmente las tareas de convertir PDF en HTML utilizando Python.

Para obtener una descripción más detallada del fragmento de código y otros posibles formatos de conversión, consulte las páginas Documentación. Además, puedes consultar las otras conversiones de formatos compatibles con nuestra biblioteca.

Con la biblioteca Aspose.PDF for .NET puedes convertir PDF en HTML mediante programación. El software PDF de Aspose es ideal para particulares, pequeñas o grandes empresas. Dado que es capaz de procesar una gran cantidad de información, realice la conversión de forma rápida y eficiente y proteja sus datos. Una característica peculiar de Aspose.PDF es una API para convertir PDF en HTML. La característica de este enfoque es que solo necesita abrir el administrador de paquetes NuGet, buscar «Aspose.pdf for .NET» e instalarlo sin ninguna configuración compleja especial. (Utilice el comando de la consola de Package Manager para realizar la instalación). Para comprobar las ventajas de la biblioteca, prueba a utilizar el fragmento de código de conversión de PDF a HTML. También puede utilizar el siguiente comando desde la consola del administrador de paquetes:

Python Package Manager Console

pip install aspose-pdf

Cómo convertir PDF a HTML


Los desarrolladores de Python for .NET pueden cargar y convertir fácilmente PDF archivos a HTML con solo unas pocas líneas de código.

  1. Agregar espacio de nombres en la clase relevante
  2. Inicializar un documento nuevo
  3. Llame al método Document.Save mientras pasa la ruta del archivo de salida y SaveFormat.Html como parámetros
  4. Finalmente, guarde el archivo HTML de salida

Este es un ejemplo que muestra cómo convertir PDF en HTML en Python. Puedes seguir estos sencillos pasos para convertir tu archivo PDF al formato HTML. Primero, carga tu archivo PDF y, a continuación, simplemente guárdalo como un archivo HTML. Puede utilizar nombres de archivo completos tanto para la lectura de PDF como para la escritura de HTML. El contenido y el formato de salida de HTML serán idénticos a los del documento PDF original.

Ejemplo: convertir PDF a HTML a través de Python

Este código de ejemplo muestra PDF a HTML Python Conversión

Input file:

File not added

Output format:

HTML

Output file:

    def convert_PDF_to_HTML(self, infile, outfile):
        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # Open PDF document

        document = Document(path_infile)

        # save document in HTML format

        save_options = HtmlSaveOptions()
        
        document.Save(path_outfile, save_options)

Convierta PDF en HTML utilizando la biblioteca Python for .NET

Aspose.PDF para Python a través de la API de.NET es compatible con los estándares y especificaciones de PDF más establecidos. Permite a los desarrolladores insertar tablas, gráficos, imágenes, hipervínculos, fuentes personalizadas (y mucho más) en documentos PDF. Además, también es posible comprimir documentos PDF. Aspose.PDF para Python a través de.NET proporciona excelentes funciones de seguridad para desarrollar documentos PDF seguros. Algunas de las funciones clave de Aspose.PDF para Python a través de la API.NET incluyen:

  • Posibilidad de leer y exportar PDF en múltiples formatos de imagen, incluidos BMP, GIF, JPEG y PNG.
  • Establezca la información básica (por ejemplo, autor, creador) del documento PDF.
  • Funciones de conversión: convierte PDF a Word, Excel y PowerPoint. Convierte PDF a formatos de imágenes. Convierte archivos PDF a formato HTML y viceversa. Convierte PDF a EPUB, texto, XPS, etc.

Puedes encontrar más información sobre Aspose.PDF para Python a través de la API.NET en nuestra documentación sobre cómo usar la API.