Konvertierung von PDF-Dokumenten über Python for Java

Exportieren von PDF-Dateien in Microsoft Office® Word-, Excel-, PowerPoint-Präsentationen, Bilder, HTML- und Formate mit festem Layout

Überschau

Suchen Sie nach einer Möglichkeit, PDF-Dateien mit Python und Java in andere Formate zu konvertieren? Aspose.PDF für Python via Java ist die ideale Lösung für die Konvertierung von PDF-Dokumenten. Python ist eine objektorientierte Programmiersprache, die häufig zur Entwicklung von Softwareprototypen für Webanwendungen und Datenverarbeitung verwendet wird. In diesem Artikel zeigen wir Ihnen, wie Sie PDF mit Python über Java in Text konvertieren. PDF-Dateien können eine Vielzahl von Inhalten enthalten, darunter Text, Bilder, anklickbare Schaltflächen, Hyperlinks, eingebettete Schriftarten, Signaturen und Stempel. Bei der Konvertierung einer PDF-Datei in ein anderes Format sind Benutzer häufig daran interessiert, den PDF-Inhalt bearbeiten zu können. Mit Aspose.PDF für Python über Java können Sie Ihre PDF-Dokumente einfach und schnell in die gängigsten Formate konvertieren und umgekehrt. Unsere Bibliothek stellt sicher, dass Ihre PDF-Dateien erfolgreich und korrekt konvertiert werden.

PDF zu Word konvertieren

Beispiel: Python über Java für die Konvertierung von PDF in Word

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Mit der Aspose.PDF for Python API können Sie PDF-Dokumente in Python über Java einfach lesen und in das DOCX-Format konvertieren. DOCX ist ein weit verbreitetes Dateiformat für Microsoft Word-Dokumente, dessen Struktur XML- und Binärdateien kombiniert, im Gegensatz zu dem einfachen Binärformat, das von seinem Vorgänger DOC verwendet wurde. DOCX-Dateien können zwar mit Word 2007 und neueren Versionen geöffnet werden, frühere Versionen von MS Word, die DOC-Dateierweiterungen unterstützen, können sie jedoch nicht öffnen. Mit diesem Code können Sie Ihre PDF-Dokumente mithilfe der Aspose.PDF for Python API nahtlos in das DOCX-Format konvertieren.

PDF in Excel-Dateien konvertieren

PDF in Excel-Dateien konvertieren

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Aspose.PDF für Python via Java bietet eine Funktion zum Konvertieren von PDF-Dateien in Excel- und CSV-Formate. Auf diese Weise können Sie problemlos tabellarische Daten aus PDF-Dateien extrahieren und in Excel oder anderen Anwendungen verwenden, die CSV-Dateien unterstützen. Aspose.PDF für Python via Java ist eine leistungsstarke Komponente zur PDF-Manipulation, die jetzt eine Funktion zum Rendern von PDF-Dateien als Excel-Arbeitsmappen (XLSX-Dateien) enthält. Mit dieser Funktion wird jede Seite der PDF-Datei in ein separates Excel-Arbeitsblatt konvertiert, sodass Sie die Daten in Excel problemlos bearbeiten und analysieren können. Unabhängig davon, ob Sie Daten aus PDF-Dateien extrahieren oder zur weiteren Analyse in Excel konvertieren müssen, bietet Aspose.PDF für Python über Java die Funktionen, die Sie benötigen, um die Arbeit schnell und einfach zu erledigen.

PDF in PowerPoint-Präsentationen konvertieren

Beispiel: Konvertierung von Python über Java von PDF zu PowerPoint

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Mit Aspose.PDF für Python über Java können Sie den Fortschritt der Konvertierung von PDF in PPTX einfach verfolgen. Dies kann hilfreich sein, wenn Sie mit großen oder komplexen PDF-Dateien arbeiten, deren Konvertierung einige Zeit in Anspruch nimmt. Neben der Konvertierung von Aspose.PDF bieten wir auch die Aspose.Slides API an, mit der PPT/PPTX-Präsentationen erstellt und bearbeitet werden können. Diese API enthält eine Funktion zum Konvertieren von PPT/PPTX-Dateien in das PDF-Format. Während dieses Konvertierungsvorgangs wird jede Seite der PDF-Datei in eine separate Folie in der PPTX-Datei konvertiert, sodass Sie die Präsentation problemlos bearbeiten und bearbeiten können. Egal, ob Sie PDF-Dateien in PPTX konvertieren oder Präsentationen erstellen und bearbeiten müssen, Aspose.PDF für Python über Java und die Aspose.Slides API bietet die Funktionen, die Sie benötigen, um Ihren Arbeitsablauf zu optimieren und die Arbeit effizient zu erledigen.

PDF in HTML-Datei konvertieren

Beispiel: Python über Java für die Konvertierung von PDF in HTML

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Aspose.PDF für Python via Java ist ein leistungsstarkes Tool zum Konvertieren verschiedener Dateiformate in PDF-Dokumente sowie zum Konvertieren von PDF-Dateien in verschiedene Ausgabeformate. Wir werden untersuchen, wie man eine PDF-Datei mit Aspose.PDF für Python über Java in HTML konvertiert. Das Konvertieren von PDF in HTML kann nützlich sein, wenn Sie eine Website erstellen oder Inhalte zu einem Online-Forum hinzufügen möchten. Mit nur wenigen Zeilen Python-Code können Sie Ihre PDF-Dokumente problemlos in das HTML-Format konvertieren. Dieser Prozess kann mit Python automatisiert werden, sodass eine große Anzahl von Dateien schnell und effizient konvertiert werden kann. Egal, ob Sie eine einzelne PDF-Datei oder einen großen Stapel von Dateien konvertieren müssen, Aspose.PDF für Python über Java bietet die Funktionen, die Sie benötigen, um Ihren Arbeitsablauf zu optimieren und die Arbeit effizient zu erledigen.

PDF in Bilder konvertieren

Beispiel: Python über Java für die Konvertierung von PDF in Bilder

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Aspose.PDF für Python bietet verschiedene Methoden zum Konvertieren von PDF-Dokumenten in Bilder. Zwei gängige Ansätze sind der Geräteansatz und der SaveOption-Ansatz. In diesem Abschnitt werden wir untersuchen, wie diese Ansätze verwendet werden können, um PDF-Dateien in gängige Bildformate wie BMP, JPEG, GIF, PNG, EMF, TIFF und SVG zu konvertieren. Die Bibliothek enthält verschiedene Klassen, die es Ihnen ermöglichen, ein virtuelles Gerät zum Transformieren von Bildern zu verwenden. Die DocumentDevice-Klasse dient zur Konvertierung des gesamten Dokuments, während die ImageDevice-Klasse für eine bestimmte Seite vorgesehen ist.