Konverter Format PDF melalui Aspose.PDF untuk Python for Java

Ekspor PDF ke Microsoft Office® Word, Excel, Presentasi PowerPoint, Gambar, HTML, dan format tata letak tetap

Ringkasan

Apakah Anda mencari cara untuk mengonversi file PDF ke format lain menggunakan Python dan Java? Aspose.PDF untuk Python melalui Java adalah solusi ideal untuk mengonversi dokumen PDF. Python adalah bahasa pemrograman berorientasi objek yang biasa digunakan untuk mengembangkan prototipe perangkat lunak untuk aplikasi web dan pemrosesan data. Pada artikel ini, kami akan menunjukkan cara mengonversi PDF ke teks menggunakan Python melalui Java. File PDF dapat berisi berbagai konten, termasuk teks, gambar, tombol yang dapat diklik, hyperlink, font tertanam, tanda tangan, dan perangko. Saat mengonversi file PDF ke format yang berbeda, pengguna sering tertarik untuk dapat mengedit konten PDF. Dengan Aspose.PDF untuk Python melalui Java, Anda dapat dengan mudah dan cepat mengonversi dokumen PDF Anda ke format paling populer dan sebaliknya. Perpustakaan kami memastikan bahwa file PDF Anda dikonversi dengan sukses dan akurat.

Konversi PDF ke Word

Contoh: Python melalui Java untuk Konversi PDF ke Word

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Menggunakan Aspose.PDF untuk Python API, Anda dapat dengan mudah membaca dan mengonversi dokumen PDF ke format DOCX di Python melalui Java. DOCX adalah format file yang banyak digunakan untuk dokumen Microsoft Word, yang memiliki struktur yang menggabungkan file XML dan biner, tidak seperti format biner biasa yang digunakan oleh pendahulunya, DOC. Sementara file DOCX dapat dibuka dengan Word 2007 dan versi yang lebih baru, versi MS Word sebelumnya yang mendukung ekstensi file DOC tidak dapat membukanya. Dengan kode ini, Anda dapat dengan mulus mengonversi dokumen PDF Anda ke format DOCX menggunakan Aspose.PDF untuk Python API.

Konversi PDF ke File Excel

Konversi PDF ke File Excel

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Aspose.PDF untuk Python melalui Java menyediakan fitur untuk mengonversi file PDF ke format Excel dan CSV. Ini memungkinkan Anda untuk dengan mudah mengekstrak data tabular dari file PDF dan menggunakannya di Excel atau aplikasi lain yang mendukung file CSV. Aspose.PDF untuk Python melalui Java adalah komponen manipulasi PDF yang kuat yang sekarang menyertakan fitur untuk merender file PDF sebagai buku kerja Excel (file XLSX). Dengan fitur ini, setiap halaman file PDF dikonversi ke lembar kerja Excel terpisah, sehingga mudah untuk bekerja dengan dan menganalisis data di Excel. Apakah Anda perlu mengekstrak data dari file PDF atau mengonversinya ke Excel untuk analisis lebih lanjut, Aspose.PDF untuk Python melalui Java dapat menyediakan fungsionalitas yang Anda butuhkan untuk menyelesaikan pekerjaan dengan cepat dan mudah.

Konversi PDF ke Presentasi PowerPoint

Contoh: Konversi Python melalui Java PDF ke PowerPoint

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Dengan Aspose.PDF untuk Python melalui Java, Anda dapat dengan mudah melacak kemajuan konversi PDF ke PPTX. Ini dapat membantu saat bekerja dengan file PDF besar atau kompleks yang membutuhkan waktu untuk dikonversi. Selain konversi Aspose.PDF, kami juga menawarkan Aspose.Slides API, yang menyediakan kemampuan untuk membuat dan memanipulasi presentasi PPT/PPTX. API ini menyertakan fitur untuk mengonversi file PPT/PPTX ke format PDF. Selama proses konversi ini, setiap halaman file PDF dikonversi ke slide terpisah dalam file PPTX, sehingga mudah untuk bekerja dengan dan mengedit presentasi. Apakah Anda perlu mengonversi file PDF ke PPTX atau membuat dan memanipulasi presentasi, Aspose.PDF untuk Python melalui Java dan Aspose.Slides API dapat menyediakan fungsionalitas yang Anda butuhkan untuk merampingkan alur kerja Anda dan menyelesaikan pekerjaan secara efisien.

Konversi PDF ke file HTML

Contoh: Python melalui Java untuk Konversi PDF ke HTML

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Aspose.PDF untuk Python melalui Java adalah alat yang ampuh untuk mengonversi berbagai format file ke dokumen PDF, serta mengonversi file PDF ke format output yang berbeda. Kami akan mengeksplorasi cara mengonversi file PDF ke HTML menggunakan Aspose.PDF untuk Python melalui Java. Mengkonversi PDF ke HTML dapat berguna jika Anda ingin membuat situs web atau menambahkan konten ke forum online. Hanya dengan beberapa baris kode Python, Anda dapat dengan mudah mengonversi dokumen PDF Anda ke format HTML. Proses ini dapat diotomatisasi menggunakan Python, menjadikannya cara cepat dan efisien untuk mengonversi sejumlah besar file. Apakah Anda perlu mengonversi satu file PDF atau sejumlah besar file, Aspose.PDF untuk Python melalui Java dapat menyediakan fungsionalitas yang Anda butuhkan untuk merampingkan alur kerja Anda dan menyelesaikan pekerjaan secara efisien.

Konversi PDF ke Gambar

Contoh: Python melalui Java untuk konversi PDF ke Gambar

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Aspose.PDF untuk Python menyediakan metode yang berbeda untuk mengonversi dokumen PDF menjadi gambar. Dua pendekatan umum adalah pendekatan Perangkat dan pendekatan SaveOption. Pada bagian ini, kita akan mengeksplorasi cara menggunakan pendekatan ini untuk mengonversi PDF ke format gambar populer seperti BMP, JPEG, GIF, PNG, EMF, TIFF, dan SVG. Perpustakaan berisi berbagai kelas yang memungkinkan Anda menggunakan perangkat virtual untuk mengubah gambar. Kelas DocumentDevice dirancang untuk mengonversi seluruh dokumen, sedangkan kelas ImageDevice ditujukan untuk halaman tertentu.