تبدیل سند PDF از طریق Python for Java

صادرات PDF به مایکروسافت آفیس® ورد، اکسل، پاورپوینت ارائه، تصاویر، HTML و فرمت های طرح ثابت

بررسی اجمالی

آیا شما به دنبال راهی برای تبدیل فایل های PDF به فرمت های دیگر با استفاده از پایتون و جاوا هستید؟ Aspose.PDF برای پایتون از طریق جاوا راه حل ایده آل برای تبدیل اسناد PDF است. پایتون یک زبان برنامه‌نویسی شی گرا است که معمولاً برای توسعه نمونه‌های نرم‌افزاری برای برنامه‌های کاربردی وب و پردازش داده‌ها استفاده می‌شود. در این مقاله، ما به شما نحوه تبدیل PDF به متن با استفاده از پایتون از طریق جاوا را نشان خواهیم داد. فایل های PDF می توانند شامل انواع محتوا، از جمله متن، تصاویر، دکمه های قابل کلیک، لینک ها، فونت های جاسازی شده، امضا و تمبر باشند. هنگام تبدیل یک فایل PDF به فرمت های مختلف، کاربران اغلب علاقه مند به ویرایش محتوای PDF هستند. با استفاده از Aspose.PDF برای پایتون از طریق جاوا، شما می توانید به راحتی و به سرعت اسناد PDF خود را به محبوب ترین فرمت ها تبدیل کنید و بالعکس. کتابخانه ما تضمین می کند که فایل های PDF خود را با موفقیت و با دقت تبدیل شده است.

تبدیل PDF به ورد

مثال: پایتون از طریق جاوا برای تبدیل PDF به Word

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

با استفاده از Aspose.PDF برای پایتون API، شما به راحتی می توانید خواندن و تبدیل اسناد PDF به فرمت DOCX در پایتون از طریق جاوا. DOCX یک فرمت فایل پرکاربرد برای اسناد مایکروسافت ورد است که ساختاری دارد که ترکیبی از XML و فایل‌های باینری است، برخلاف قالب باینری ساده که توسط سلف خود یعنی DOC استفاده می‌شود. در حالی که فایل های DOCX را می توان با ورد 2007 و نسخه های بعد باز کرد، نسخه های قبلی MS Word که از پسوند فایل DOC پشتیبانی می کنند قادر به باز کردن آنها نیستند. با استفاده از این کد، شما می توانید اسناد PDF خود را به فرمت DOCX با استفاده از Aspose.PDF برای Python API تبدیل کنید.

تبدیل PDF به فایل های اکسل

تبدیل PDF به فایل های اکسل

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Aspose.PDF برای پایتون از طریق جاوا یک ویژگی برای تبدیل فایل های PDF به فرمت های اکسل و CSV فراهم می کند. این امکان را برای شما فراهم می کند تا به راحتی داده های جدولی را از فایل های PDF استخراج کرده و از آن در Excel یا سایر برنامه هایی که از فایل های CSV پشتیبانی می کنند استفاده کنید. Aspose.PDF برای پایتون از طریق جاوا یک کامپوننت قدرتمند دستکاری PDF است که در حال حاضر شامل یک ویژگی برای رندر فایل های PDF به عنوان کتاب های اکسل (فایل های XLSX) است. با استفاده از این ویژگی، هر صفحه از فایل PDF به یک برگه اکسل جداگانه تبدیل می شود، و آن را آسان برای کار با و تجزیه و تحلیل داده ها در اکسل. این که آیا شما نیاز به استخراج داده ها از فایل های PDF دارید یا آنها را برای تجزیه و تحلیل بیشتر به اکسل تبدیل کنید، Aspose.PDF برای پایتون از طریق جاوا می تواند قابلیت های مورد نیاز برای انجام سریع و آسان کار را فراهم کند.

تبدیل PDF به ارائه پاورپوینت

مثال: پایتون از طریق جاوا PDF به پاورپوینت تبدیل

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

با Aspose.PDF برای پایتون از طریق جاوا، شما به راحتی می توانید پیگیری پیشرفت PDF به PPTX تبدیل. این می تواند مفید باشد در هنگام کار با فایل های PDF بزرگ و یا پیچیده است که برخی از زمان برای تبدیل. علاوه بر تبدیل Aspose.PDF، ما API Aspose.Slides را نیز ارائه می دهیم که توانایی ایجاد و دستکاری ارائه های PPT/PPTX را فراهم می کند. این API شامل یک ویژگی برای تبدیل فایل های PPT/PPTX به فرمت PDF است. در طی این فرآیند تبدیل، هر صفحه از فایل PDF به یک اسلاید جداگانه در فایل PPTX تبدیل می شود، و کار با آن را آسان می کند و ارائه را ویرایش می کند. این که آیا شما نیاز به تبدیل فایل های PDF به PPTX دارید یا ارائه ها را ایجاد و دستکاری کنید، Aspose.PDF برای Python از طریق Java و Aspose.Slides API می تواند قابلیت های مورد نیاز برای ساده سازی گردش کار خود را فراهم کند و کار را به طور موثر انجام دهد.

تبدیل PDF به فایل HTML

مثال: پایتون از طریق جاوا برای تبدیل PDF به HTML

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Aspose.PDF برای پایتون از طریق جاوا یک ابزار قدرتمند برای تبدیل فرمت های مختلف فایل به اسناد PDF و همچنین تبدیل فایل های PDF به فرمت های خروجی مختلف است. ما نحوه تبدیل یک فایل PDF به HTML با استفاده از Aspose.PDF برای پایتون از طریق جاوا را بررسی خواهیم کرد. تبدیل PDF به HTML می تواند مفید باشد اگر می خواهید یک وب سایت ایجاد کنید یا محتوا را به یک انجمن آنلاین اضافه کنید. تنها با چند خط کد پایتون، شما به راحتی می توانید اسناد PDF خود را به فرمت HTML تبدیل کنید. این فرآیند را می توان با استفاده از پایتون خودکار کرد، و آن را به یک روش سریع و کارآمد برای تبدیل تعداد زیادی فایل تبدیل کرد. این که آیا شما نیاز به تبدیل یک فایل PDF یا یک دسته بزرگ از فایل ها دارید، Aspose.PDF برای پایتون از طریق جاوا می تواند قابلیت های مورد نیاز برای ساده سازی گردش کار خود را فراهم کند و کار را به طور موثر انجام دهد.

تبدیل PDF به تصاویر

مثال: پایتون از طریق جاوا برای تبدیل PDF به تصاویر

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Aspose.PDF برای پایتون روش‌های مختلفی را برای تبدیل اسناد پی‌دی‌اف به تصاویر ارائه می‌دهد. دو روش معمول عبارتند از رویکرد دستگاه و رویکرد SaveOption. در این بخش نحوه استفاده از این رویکردها برای تبدیل فایلهای PDF به فرمت های تصویری محبوب مانند BMP، JPEG، GIF، PNG، EMF، TIFF و SVG را بررسی خواهیم کرد. کتابخانه شامل کلاس های مختلفی است که شما را قادر می سازد از یک دستگاه مجازی برای تبدیل تصاویر استفاده کنید. کلاس DocumentDevice برای تبدیل کل سند طراحی شده است، در حالی که کلاس ImageDevice برای یک صفحه خاص طراحی شده است.