Python for Java ile PDF Belge Dönüştürme

PDF’yi Microsoft Office® Word, Excel, PowerPoint Sunumları, Görüntüler, HTML ve sabit düzen biçimlerine aktarın

Genel bakış

Python ve Java kullanarak PDF dosyalarını diğer biçimlere dönüştürmenin bir yolunu mu arıyorsunuz? Java üzerinden Python için Aspose.PDF, PDF belgelerini dönüştürmek için ideal bir çözümdür. Python, web uygulamaları ve veri işleme için yazılım prototipleri geliştirmek için yaygın olarak kullanılan nesne yönelimli bir programlama dilidir.. Bu makalede, Java üzerinden Python kullanarak PDF’yi metne nasıl dönüştüreceğinizi göstereceğiz. PDF dosyaları metin, resimler, tıklanabilir düğmeler, köprüler, gömülü yazı tipleri, imzalar ve pullar dahil olmak üzere çeşitli içerikler içerebilir. Bir PDF dosyasını farklı bir biçime dönüştürürken, kullanıcılar genellikle PDF içeriğini düzenleyebilmekle ilgilenirler. Java üzerinden Python için Aspose.PDF ile PDF belgelerinizi en popüler formatlara kolayca ve hızlı bir şekilde dönüştürebilirsiniz. Kütüphanemiz, PDF dosyalarınızın başarılı ve doğru bir şekilde dönüştürülmesini sağlar.

PDF'yi Word'e Dönüştür

Örnek: PDF'den Word'e Dönüştürme için Java üzerinden Python

    from asposepdf import Api

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.docx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.DocSaveOptions()
    save_options.format = Api.DocSaveOptions.DocFormat.Docx
    # Set the recognition mode as Flow
    save_options.mode = Api.DocSaveOptions.RecognitionMode.Flow
    # Set the Horizontal proximity as 2.5
    save_options.relative_horizontal_proximity = 2.5
    # Enable the value to recognize bullets during conversion process
    save_options.recognize_bullets = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Python API için Aspose.PDF kullanarak PDF belgelerini kolayca okuyabilir ve Java aracılığıyla Python’da DOCX formatına dönüştürebilirsiniz. DOCX selefi DOC tarafından kullanılan düz ikili biçimi aksine, XML ve ikili dosyaları birleştiren bir yapıya sahip Microsoft Word belgeleri için yaygın olarak kullanılan bir dosya biçimidir. DOCX dosyaları Word 2007 ve sonraki sürümleri ile açılabilirken, DOC dosya uzantılarını destekleyen MS Word önceki sürümleri bunları açamıyor. Bu kodla, Python API için Aspose.PDF kullanarak PDF belgelerinizi sorunsuz bir şekilde DOCX formatına dönüştürebilirsiniz.

PDF'yi Excel Dosyalarına Dönüştür

PDF'yi Excel Dosyalarına Dönüştür

    documentName = "testdata/source.pdf"
    doc = Api.Document(documentName)
    documentOutName = "testout/result2.xls"
    doc.save(documentOutName, Api.SaveFormat.Excel)

Java üzerinden Python için Aspose.PDF, PDF dosyalarını Excel ve CSV formatlarına dönüştürmek için bir özellik sağlar. Bu, PDF dosyalarından tablo verilerini kolayca çıkarmanıza ve Excel’de veya CSV dosyalarını destekleyen diğer uygulamalarda kullanmanıza olanak tanır. Java üzerinden Python için Aspose.PDF, PDF dosyalarını Excel çalışma kitapları (XLSX dosyaları) olarak işlemek için bir özellik içeren güçlü bir PDF işleme bileşenidir. Bu özellik sayesinde, PDF dosyasının her sayfası ayrı bir Excel çalışma sayfasına dönüştürülür ve bu da Excel’deki verilerle çalışmayı ve analiz etmeyi kolaylaştırır. PDF dosyalarından veri ayıklamanız veya daha fazla analiz için Excel’e dönüştürmeniz gerekip gerekmediğini, Java üzerinden Python için Aspose.PDF, işi hızlı ve kolay bir şekilde halletmek için ihtiyacınız olan işlevselliği sağlayabilir.

PDF'yi PowerPoint Sunumlarına Dönüştür

Örnek: Java ile Python PDF'den PowerPoint'e Dönüştürme

    DIR_INPUT = "testdata/"
    DIR_OUTPUT = "testout/"

    input_pdf = DIR_INPUT + "Hello.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx_with_options.pptx"
    # Open PDF document
    document = Api.Document(input_pdf)

    save_options = Api.PptxSaveOptions()
    save_options._ImageResolution = 300
    save_options._SeparateImages = True
    save_options._OptimizeTextBoxes = True

    # Save the file into MS Word document format
    document.save(output_pdf, save_options)

Java üzerinden Python için Aspose.PDF ile PDF’den PPTX’e dönüşümün ilerlemesini kolayca izleyebilirsiniz. Bu, dönüştürmesi biraz zaman alan büyük veya karmaşık PDF dosyalarıyla çalışırken yardımcı olabilir. Aspose.PDF dönüşümüne ek olarak, PPT/PPTX sunumları oluşturma ve değiştirme olanağı sağlayan Aspose.Slides API’sini de sunuyoruz. Bu API, PPT/PPTX dosyalarını PDF formatına dönüştürmek için bir özellik içerir. Bu dönüştürme işlemi sırasında, PDF dosyasının her sayfası PPTX dosyasında ayrı bir slayta dönüştürülür ve sunumla çalışmayı ve düzenlemeyi kolaylaştırır. PDF dosyalarını PPTX’e dönüştürmeniz veya sunumlar oluşturup manipüle etmeniz gerekip gerekmediği, Java ve Aspose.Slides API aracılığıyla Python için Aspose.PDF, iş akışınızı kolaylaştırmak ve işi verimli bir şekilde halletmek için ihtiyacınız olan işlevselliği sağlayabilir.

PDF'yi HTML dosyasına dönüştürme

Örnek: PDF'den HTML'ye Dönüştürme için Java üzerinden Python

    from asposepdf import Api

    documentName = "../../testdata/source.pdf"
    documentOutName = "../../testout/result.html"
    # Open PDF document
    document = Api.Document(documentName)

    # save document in HTML format
    save_options = Api.HtmlSaveOptions()
    document.save(documentOutName, save_options)

Java üzerinden Python için Aspose.PDF, çeşitli dosya formatlarını PDF belgelerine dönüştürmek ve PDF dosyalarını farklı çıktı formatlarına dönüştürmek için güçlü bir araçtır. Java üzerinden Python için Aspose.PDF kullanarak bir PDF dosyasını HTML’ye nasıl dönüştüreceğimizi keşfedeceğiz. Bir web sitesi oluşturmak veya çevrimiçi bir foruma içerik eklemek istiyorsanız PDF’yi HTML’ye dönüştürmek yararlı olabilir. Sadece birkaç satır Python kodu ile PDF belgelerinizi kolayca HTML formatına dönüştürebilirsiniz. Bu süreç o dosyaların çok sayıda dönüştürmek için hızlı ve verimli bir yol yapma, Python kullanılarak otomatik hale getirilebilir. İster tek bir PDF dosyasını ister büyük bir dosya grubunu dönüştürmeniz gerekip gerekmediği, Java üzerinden Python için Aspose.PDF, iş akışınızı kolaylaştırmak ve işi verimli bir şekilde halletmek için ihtiyacınız olan işlevselliği sağlayabilir.

PDF'yi Görüntülere Dönüştür

Örnek: PDF'den Görüntülere dönüştürme için Java üzerinden Python

    from asposepdf import Api, Device

    DIR_INPUT = "../../testdata/"
    DIR_OUTPUT = "../../testout/"

    input_pdf = DIR_INPUT + "source.pdf"
    output_pdf = DIR_OUTPUT + "image"
    # Open PDF document
    document = Api.Document(input_pdf)

    # Create Resolution object
    resolution = Device.Resolution(300)
    device = Device.JpegDevice(resolution)

    for i in range(0, document.getPages.size):
        # Create filename for save
        imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.jpeg"
        # Convert a particular page and save the image to file
        device.process(document.getPages.getPage(i + 1), outputFileName=imageFileName)

Python için Aspose.PDF, PDF belgelerini görüntülere dönüştürmek için farklı yöntemler sunar. İki yaygın yaklaşım Cihaz yaklaşımı ve SaveOption yaklaşımıdır. Bu bölümde, PDF’leri BMP, JPEG, GIF, PNG, EMF, TIFF ve SVG gibi popüler görüntü formatlarına dönüştürmek için bu yaklaşımların nasıl kullanılacağını keşfedeceğiz. Kütüphane, görüntüleri dönüştürmek için sanal bir aygıt kullanmanıza olanak tanıyan çeşitli sınıflar içerir. DocumentDevice sınıfı, tüm belgeyi dönüştürmek için tasarlanırken, ImageDevice sınıfı belirli bir sayfaya yöneliktir.