Conversione di documenti PDF tramite Python for Java

Esportazione di PDF in Microsoft Office® Word, Excel, presentazioni PowerPoint, immagini, HTML e formati a layout fisso

Panoramica

Stai cercando un modo per convertire file PDF in altri formati usando Python e Java? Aspose.PDF per Python via Java è la soluzione ideale per convertire documenti PDF. Python è un linguaggio di programmazione orientato agli oggetti che viene comunemente utilizzato per sviluppare prototipi software per applicazioni web ed elaborazione dati. In questo articolo, ti mostreremo come convertire PDF in testo usando Python tramite Java. I file PDF possono contenere una varietà di contenuti, tra cui testo, immagini, pulsanti cliccabili, collegamenti ipertestuali, caratteri incorporati, firme e timbri. Quando si converte un file PDF in un formato diverso, gli utenti sono spesso interessati a poter modificare il contenuto del PDF. Con Aspose.PDF per Python tramite Java, puoi convertire facilmente e rapidamente i tuoi documenti PDF nei formati più diffusi e viceversa. La nostra libreria garantisce che i tuoi file PDF vengano convertiti correttamente e con precisione.

Convertire PDF in Word

Esempio: Python tramite Java per la conversione da PDF a Word

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Utilizzando l’API Aspose.PDF for Python, puoi leggere e convertire facilmente documenti PDF in formato DOCX in Python tramite Java. DOCX è un formato di file ampiamente utilizzato per i documenti Microsoft Word, che ha una struttura che combina file XML e binari, a differenza del semplice formato binario utilizzato dal suo predecessore, DOC. Mentre i file DOCX possono essere aperti con Word 2007 e versioni successive, le versioni precedenti di MS Word che supportano le estensioni dei file DOC non sono in grado di aprirli. Con questo codice, puoi convertire senza problemi i tuoi documenti PDF in formato DOCX utilizzando l’API Aspose.PDF per Python.

Convertire file PDF in Excel

Convertire file PDF in Excel

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Aspose.PDF per Python tramite Java fornisce una funzionalità per la conversione di file PDF in formati Excel e CSV. Ciò consente di estrarre facilmente i dati tabulari dai file PDF e utilizzarli in Excel o in altre applicazioni che supportano i file CSV. Aspose.PDF per Python via Java è un potente componente di manipolazione PDF che ora include una funzionalità per il rendering di file PDF come cartelle di lavoro Excel (file XLSX). Con questa funzionalità, ogni pagina del file PDF viene convertita in un foglio di lavoro Excel separato, semplificando l’utilizzo e l’analisi dei dati in Excel. Sia che tu debba estrarre dati da file PDF o convertirli in Excel per ulteriori analisi, Aspose.PDF for Python tramite Java può fornire le funzionalità necessarie per portare a termine il lavoro in modo rapido e semplice.

Convertire presentazioni PDF in PowerPoint

Esempio: conversione da Python tramite Java PDF a PowerPoint

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Con Aspose.PDF per Python tramite Java, puoi facilmente monitorare l’avanzamento della conversione da PDF a PPTX. Questo può essere utile quando si lavora con file PDF grandi o complessi che richiedono del tempo per essere convertiti. Oltre alla conversione di Aspose.PDF, offriamo anche l’API Aspose.Slides, che offre la possibilità di creare e manipolare presentazioni PPT/PPTX. Questa API include una funzionalità per la conversione di file PPT/PPTX in formato PDF. Durante questo processo di conversione, ogni pagina del file PDF viene convertita in una diapositiva separata nel file PPTX, semplificando l’utilizzo e la modifica della presentazione. Che tu debba convertire file PDF in PPTX o creare e manipolare presentazioni, Aspose.PDF for Python tramite Java e Aspose.Slides API può fornire le funzionalità necessarie per semplificare il flusso di lavoro e portare a termine il lavoro in modo efficiente.

Convertire PDF in file HTML

Esempio: Python tramite Java per la conversione da PDF a HTML

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Aspose.PDF per Python via Java è un potente strumento per convertire vari formati di file in documenti PDF, nonché per convertire file PDF in diversi formati di output. Esploreremo come convertire un file PDF in HTML usando Aspose.PDF per Python tramite Java. La conversione da PDF a HTML può essere utile se desideri creare un sito Web o aggiungere contenuti a un forum online. Con poche righe di codice Python, puoi convertire facilmente i tuoi documenti PDF in formato HTML. Questo processo può essere automatizzato utilizzando Python, rendendolo un modo rapido ed efficiente per convertire un gran numero di file. Che tu debba convertire un singolo file PDF o un grande batch di file, Aspose.PDF for Python tramite Java può fornire le funzionalità necessarie per semplificare il flusso di lavoro e portare a termine il lavoro in modo efficiente.

Convertire PDF in immagini

Esempio: Python tramite Java per la conversione da PDF a immagini

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Aspose.PDF for Python offre diversi metodi per convertire documenti PDF in immagini. Due approcci comuni sono l’approccio Device e l’approccio SaveOption. In questa sezione, esploreremo come utilizzare questi approcci per convertire i PDF nei formati di immagine più diffusi come BMP, JPEG, GIF, PNG, EMF, TIFF e SVG. La libreria contiene varie classi che consentono di utilizzare un dispositivo virtuale per trasformare le immagini. La classe DocumentDevice è progettata per convertire l’intero documento, mentre la classe ImageDevice è destinata a una pagina specifica.