Konversi Dokumen PDF melalui Python for Java

Ekspor PDF ke Microsoft Office® Word, Excel, Presentasi PowerPoint, Gambar, HTML, dan format tata letak tetap

Ringkasan

Apakah Anda mencari cara untuk mengonversi file PDF ke format lain menggunakan Python dan Java? Aspose.PDF untuk Python melalui Java adalah solusi ideal untuk mengkonversi dokumen PDF. Python adalah bahasa pemrograman berorientasi objek yang biasa digunakan untuk mengembangkan prototipe perangkat lunak untuk aplikasi web dan pengolahan data. Pada artikel ini, kami akan menunjukkan cara mengonversi PDF ke teks menggunakan Python melalui Java. File PDF dapat berisi berbagai konten, termasuk teks, gambar, tombol yang dapat diklik, hyperlink, font tertanam, tanda tangan, dan perangko. Saat mengonversi file PDF ke format yang berbeda, pengguna sering tertarik untuk dapat mengedit konten PDF. Dengan Aspose.PDF untuk Python melalui Java, Anda dapat dengan mudah dan cepat mengkonversi dokumen PDF Anda ke format yang paling populer dan sebaliknya. Perpustakaan kami memastikan bahwa file PDF Anda berhasil dikonversi dan akurat.

Konversi PDF ke Word

Contoh: Python melalui Java untuk Konversi PDF ke Word

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Menggunakan Aspose.PDF untuk Python API, Anda dapat dengan mudah membaca dan mengkonversi dokumen PDF ke format DOCX dalam Python melalui Java. DOCX adalah format file yang banyak digunakan untuk dokumen Microsoft Word, yang memiliki struktur yang menggabungkan file XMLdan biner, tidak seperti format biner biasa yang digunakan oleh pendahulunya, DOC. Sementara file DOCX dapat dibuka dengan Word 2007 dan versi yang lebih baru, versi MS Word yang mendukung ekstensi file DOC tidak dapat membukanya. Dengan kode ini, Anda dapat dengan mulus mengkonversi dokumen PDF Anda ke format DOCX menggunakan Aspose.PDF untuk Python API.

Konversi PDF ke File Excel

Konversi PDF ke File Excel

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Aspose.PDF untuk Python melalui Java menyediakan fitur untuk mengkonversi file PDF ke format Excel dan CSV. Ini memungkinkan Anda untuk dengan mudah mengekstrak data tabular dari file PDF dan menggunakannya di Excel atau aplikasi lain yang mendukung file CSV. Aspose.PDF untuk Python melalui Java adalah komponen manipulasi PDF yang kuat yang sekarang menyertakan fitur untuk rendering file PDF sebagai buku kerja Excel (file XLSX). Dengan fitur ini, setiap halaman file PDF dikonversi ke lembar kerja Excel terpisah, sehingga mudah untuk dikerjakan dan menganalisis data di Excel. Apakah Anda perlu mengekstrak data dari file PDF atau mengonversinya ke Excel untuk analisis lebih lanjut, Aspose.PDF untuk Python melalui Java dapat menyediakan fungsionalitas yang Anda butuhkan untuk menyelesaikan pekerjaan dengan cepat dan mudah.

Konversi PDF ke Presentasi PowerPoint

Contoh: Python melalui Konversi Java PDF ke PowerPoint

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Dengan Aspose.PDF untuk Python melalui Java, Anda dapat dengan mudah melacak kemajuan konversi PDF ke PPTX. Ini dapat membantu saat bekerja dengan file PDF besar atau kompleks yang membutuhkan waktu untuk mengonversi. Selain konversi Aspose.PDF, kami juga menawarkan API Aspose.Slides, yang menyediakan kemampuan untuk membuat dan memanipulasi presentasi PPT/PPTX. API ini menyertakan fitur untuk mengonversi file PPT/PPTX ke format PDF. Selama proses konversi ini, setiap halaman file PDF dikonversi ke slide terpisah di file PPTX, sehingga mudah untuk bekerja dengan dan mengedit presentasi. Apakah Anda perlu mengkonversi file PDF ke PPTX atau membuat dan memanipulasi presentasi, Aspose.PDF untuk Python melalui Java dan Aspose. Slides API dapat menyediakan fungsionalitas yang Anda butuhkan untuk merampingkan alur kerja Anda dan mendapatkan pekerjaan yang dilakukan secara efisien.

Konversi PDF ke file HTML

Contoh: Python melalui Java untuk Konversi PDF ke HTML

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Aspose.PDF untuk Python melalui Java adalah alat yang ampuh untuk mengkonversi berbagai format file ke dokumen PDF, serta mengkonversi file PDF ke format output yang berbeda. Kami akan mengeksplorasi cara mengonversi file PDF ke HTML menggunakan Aspose.PDF untuk Python melalui Java. Mengonversi PDF ke HTML dapat berguna jika Anda ingin membuat situs web atau menambahkan konten ke forum online. Dengan hanya beberapa baris kode Python, Anda dapat dengan mudah mengkonversi dokumen PDF Anda ke format HTML. Proses ini dapat otomatis menggunakan Python, sehingga cara cepat dan efisien untuk mengkonversi sejumlah besar file. Apakah Anda perlu mengonversi satu file PDF atau sejumlah besar file, Aspose.PDF untuk Python melalui Java dapat menyediakan fungsionalitas yang Anda butuhkan untuk merampingkan alur kerja Anda dan menyelesaikan pekerjaan secara efisien.

Konversi PDF ke Gambar

Contoh: Python melalui Java untuk konversi PDF ke Gambar

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Aspose.PDF untuk Python menyediakan metode yang berbeda untuk mengkonversi dokumen PDF ke gambar. Dua pendekatan umum adalah pendekatan Perangkat dan pendekatan SaveOption. Pada bagian ini, kita akan mengeksplorasi cara menggunakan pendekatan ini untuk mengonversi PDF ke format gambar populer seperti BMP, JPEG, GIF, PNG, EMF, TIFF, dan SVG. Perpustakaan berisi berbagai kelas yang memungkinkan Anda untuk menggunakan perangkat virtual untuk mengubah gambar. Kelas DocumentDevice dirancang untuk mengubah seluruh dokumen, sedangkan kelas ImageDevice ditujukan untuk halaman tertentu.