การแปลงเอกสาร PDF ผ่านทาง Python for Java

ส่งออก PDF ไปยัง Microsoft Office® Word, Excel, งานนำเสนอ PowerPoint, รูปภาพ, HTML และรูปแบบเค้าโครงคงที่

ภาพรวม

คุณกำลังมองหาวิธีที่จะแปลงไฟล์ PDF เป็นรูปแบบอื่น ๆ โดยใช้ Python และ Java หรือไม่?Aspose.PDF สำหรับ Python ผ่าน Java เป็นทางออกที่ดีสำหรับการแปลงเอกสาร PDFPython เป็นภาษาโปรแกรมเชิงวัตถุที่นิยมใช้ในการพัฒนาต้นแบบซอฟต์แวร์สำหรับการใช้งานเว็บและการประมวลผลข้อมูลในบทความนี้เราจะแสดงวิธีการแปลง PDF เป็นข้อความโดยใช้ Python ผ่าน Javaไฟล์ PDF สามารถมีเนื้อหาที่หลากหลายรวมทั้งข้อความ, ภาพ, ปุ่มคลิกได้, ไฮเปอร์ลิงก์, แบบอักษรฝังตัว, ลายเซ็นและแสตมป์เมื่อแปลงไฟล์ PDF เป็นรูปแบบอื่นผู้ใช้มักจะสนใจที่จะสามารถแก้ไขเนื้อหา PDFด้วย Aspose.PDF สำหรับ Python ผ่าน Java คุณสามารถแปลงเอกสาร PDF ของคุณเป็นรูปแบบที่นิยมมากที่สุดและในทางกลับกันได้อย่างง่ายดายและรวดเร็วคลังของเรามั่นใจว่าไฟล์ PDF ของคุณจะถูกแปลงเรียบร้อยและถูกต้อง

แปลงไฟล์ PDF เป็น Word

ตัวอย่าง: งูหลามผ่าน Java สำหรับ PDF เป็น Word แปลง

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

ใช้ Aspose.PDF สำหรับหลาม API คุณสามารถอ่านและแปลงเอกสาร PDF เป็นรูปแบบ DOCX ในหลามผ่าน JavaDOCX เป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลายสำหรับเอกสาร Microsoft Word ซึ่งมีโครงสร้างที่รวมไฟล์ XML และไบนารีซึ่งแตกต่างจากรูปแบบไบนารีธรรมดาที่ใช้โดยรุ่นก่อน DOCในขณะที่ไฟล์ DOCX สามารถเปิดได้ด้วย Word 2007 และรุ่นที่ใหม่กว่า แต่รุ่นก่อนหน้าของ MS Word ที่สนับสนุนนามสกุลไฟล์ DOC จะไม่สามารถเปิดไฟล์ได้ด้วยรหัสนี้คุณสามารถแปลงเอกสาร PDF ของคุณเป็นรูปแบบ DOCX โดยใช้ Aspose.PDF สำหรับ Python API

แปลงไฟล์ PDF เป็นไฟล์ Excel

แปลงไฟล์ PDF เป็นไฟล์ Excel

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Aspose.PDF สำหรับหลามผ่าน Java มีคุณสมบัติสำหรับการแปลงไฟล์ PDF เป็น Excel และ CSV รูปแบบซึ่งช่วยให้คุณสามารถดึงข้อมูลแบบตารางจากไฟล์ PDF และใช้ใน Excel หรือโปรแกรมอื่น ๆ ที่สนับสนุนไฟล์ CSV ได้อย่างง่ายดายAspose.PDF สำหรับหลามผ่าน Java เป็นองค์ประกอบการจัดการ PDF ที่มีประสิทธิภาพที่ขณะนี้มีคุณลักษณะสำหรับการแสดงผลไฟล์ PDF เป็นสมุดงาน Excel (ไฟล์ XLSX).ด้วยคุณลักษณะนี้แต่ละหน้าของไฟล์ PDF จะถูกแปลงเป็นแผ่นงาน Excel แยกต่างหากทำให้ง่ายต่อการทำงานกับและวิเคราะห์ข้อมูลใน Excelไม่ว่าคุณจะต้องการดึงข้อมูลจากไฟล์ PDF หรือแปลงเป็น Excel เพื่อการวิเคราะห์ต่อไป Aspose.PDF for Python ผ่าน Java สามารถให้ฟังก์ชันการทำงานที่คุณต้องการเพื่อให้ได้งานที่ทำได้อย่างรวดเร็วและง่ายดาย

แปลงไฟล์ PDF เป็นงานนำเสนอ PowerPoint

ตัวอย่าง: งูหลามผ่าน Java PDF เพื่อการแปลง PowerPoint

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

ด้วย Aspose.PDF สำหรับหลามผ่าน Java คุณสามารถติดตามความคืบหน้าของไฟล์ PDF เพื่อแปลง PPTXซึ่งจะมีประโยชน์เมื่อทำงานกับไฟล์ PDF ขนาดใหญ่หรือซับซ้อนซึ่งใช้เวลาในการแปลงนอกเหนือจากการแปลง Aspose.PDF เรายังมี Aspose.Slides API ซึ่งให้ความสามารถในการสร้างและจัดการงานนำเสนอ PPT/PPTXAPI นี้มีคุณลักษณะสำหรับการแปลงไฟล์ PPT/PPTX เป็นรูปแบบ PDFในระหว่างขั้นตอนการแปลงนี้แต่ละหน้าของไฟล์ PDF จะถูกแปลงเป็นสไลด์แยกต่างหากในไฟล์ PPTX ทำให้ง่ายต่อการทำงานกับและแก้ไขงานนำเสนอไม่ว่าคุณจะต้องการแปลงไฟล์ PDF เป็น PPTX หรือสร้างและจัดการงานนำเสนอ Aspose.PDF สำหรับ Python ผ่าน Java และ Aspose.Slides API สามารถให้ฟังก์ชันการทำงานที่คุณต้องการเพื่อปรับปรุงขั้นตอนการทำงานของคุณและทำงานได้อย่างมีประสิทธิภาพ

แปลงไฟล์ PDF เป็นไฟล์ HTML

ตัวอย่าง: งูหลามผ่าน Java สำหรับ PDF เป็น HTML แปลง

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Aspose.PDF สำหรับ Python ผ่าน Java เป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแปลงรูปแบบไฟล์ต่างๆเป็นเอกสาร PDF รวมถึงการแปลงไฟล์ PDF เป็นรูปแบบเอาท์พุทที่แตกต่างกันเราจะสำรวจวิธีการแปลงไฟล์ PDF เป็น HTML โดยใช้ Aspose.PDF สำหรับหลามผ่าน Javaการแปลงไฟล์ PDF เป็น HTML จะมีประโยชน์หากคุณต้องการสร้างเว็บไซต์หรือเพิ่มเนื้อหาลงในฟอรัมออนไลน์มีเพียงไม่กี่บรรทัดของรหัส Python คุณสามารถแปลงเอกสาร PDF ของคุณเป็นรูปแบบ HTMLกระบวนการนี้สามารถโดยอัตโนมัติโดยใช้หลามทำให้มันเป็นวิธีที่รวดเร็วและมีประสิทธิภาพในการแปลงไฟล์จำนวนมากไม่ว่าคุณจะต้องการแปลงไฟล์ PDF เดียวหรือไฟล์จำนวนมาก Aspose.PDF for Python ผ่าน Java สามารถให้ฟังก์ชันการทำงานที่คุณต้องการเพื่อปรับปรุงขั้นตอนการทำงานของคุณและทำงานให้เสร็จได้อย่างมีประสิทธิภาพ

แปลงไฟล์ PDF เป็นรูปภาพ

ตัวอย่าง: Python ผ่าน Java สำหรับ PDF เป็นแปลงรูปภาพ

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Aspose.PDF สำหรับงูหลามมีวิธีการที่แตกต่างกันในการแปลงเอกสาร PDF เป็นภาพสองวิธีร่วมกันเป็นวิธีการอุปกรณ์และวิธีการ SaveOptionในส่วนนี้เราจะสำรวจวิธีการใช้วิธีการเหล่านี้เพื่อแปลงไฟล์ PDF เป็นรูปแบบภาพยอดนิยมเช่น BMP, JPEG, GIF, PNG, EMF, TIFF และ SVGห้องสมุดมีชั้นเรียนต่างๆที่ช่วยให้คุณสามารถใช้อุปกรณ์เสมือนเพื่อแปลงภาพชั้น DocumentDevice ถูกออกแบบมาเพื่อแปลงเอกสารทั้งหมดในขณะที่ระดับ ImageDevice มีไว้สำหรับหน้าเว็บที่เฉพาะเจาะจง