Java ile PDF Belge Dönüştürme

PDF’yi Microsoft Office® Word, Excel, PowerPoint Sunumları, Görüntüler, HTML ve sabit düzen biçimlerine aktarın

Genel bakış

Ayrıştırma verilerini PDF formatlarında sunarken, PDF dışındaki belgeleri değiştirmeye ihtiyaç duyulduğunda birkaç durum vardır. Dolayısıyla, bu tür uygulamalar için ya kendi çözümlerinde PDF ayrıştırma işlevselliği ekleyecekleri ya da desteklenen formatlar itibariyle verileri işlemek için PDF dönüştürme işlevini ekleyecekleri iki senaryo olacaktır. İkinci senaryo için** PDF’yi Word**, Excel, HTML, Görüntüler veya gerekli herhangi bir formata dönüştürün, .NET tabanlı içinde** C# PDF okuyucu ve dönüştürücü** kodunu uygulamak basittir. Programcıların bu dönüşüm kodu parçacıklarını gereksinimleri doğrultusunda değiştirebilmeleri için burada birkaç durumu tartışıyoruz..

PDF'den Microsoft Word 2003-2019'a Dönüşüm

Örnek: PDF'den Word'e Dönüştürme için C# Kodu

// Kaynak PDF Dosyasını Yükle
Document pdfFile = new Document("Source-PDF-File.pdf");

// Kaydet seçeneklerini kullanarak kaydetme
// DocSaveOptions nesnesi oluşturma
DocSaveOptions saveOptions = new DocSaveOptions();

// Tanıma modunu Akış anlamına gelir Tam tanıma modu olarak ayarlayın
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);

// Diğer iki mod RecognitionMode.textbox ve RecognitionMode.enhancedFlow

// Yatay yakınlığı 2,5 olarak ayarlayın
saveOptions.setRelativeHorizontalProximity(2.5f);

// Dönüştürme işlemi sırasında madde işaretlerini tanımak için değeri etkinleştirin
saveOptions.setRecognizeBullets(true);

// Ortaya çıkan DOC dosyasını kaydedin
pdfDocument.save(docFile.toString(), saveOptions);

.NET kütüphanesi için Aspose.PDF, tüm PDF’den Word’e dönüşümleri destekler. Microsoft Word belgelerini herhangi bir özel ayar olmadan dönüştürüyorsak, PDF dosyasını Document sınıfından Kaydet yöntemini kullanarak yüklüyoruz ve çıktı Word belge yolu ve SaveFormat parametreleri olarak kullanacağız. Hat mesafesini, görüntü çözünürlüğünü ve daha fazla ayarı geliştirmeye ihtiyaç duyulan özel durumlar için API, tüm bu ayarları ortaya çıkaran DocSaveOptions sınıfına sahiptir.

PDF'yi Excel Dosyaları Olarak Kaydet

PDF'yi Excel Dosyaları Olarak Kaydet

// PDF belgesini yükle
Document pdfDoc = new Document("sample-file.pdf");
// ExcelSaveOptions'i Başlat
ExcelSaveOptions excelSave = new ExcelSaveOptions();
// Çıktı Excel XLSX formatını ayarla
excelSave.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Çalışma Sayfası sayısını en aza indirin
excelsave.setMinimizeTheNumberOfWorksheets(true);
// PDF'yi Excel çıktı dosyasına dönüştürün
pdfDoc.Save("pdf-to-excel-output.xlsx", excelSave);

Özel SaveFormat.excel PDF’yi belirli Microsoft Excel XLS XLSX çıktı biçimlerine kaydetmek için numaralandırma mevcuttur. Ayrıca, .NET PDF Library da var speicific ExcelSaveOptions sınıfı sadece Excel formatlarına kaydetmekle kalmaz, aynı zamanda tam çıktı formatı gibi farklı nitelikleri ayarlamak için farklı işlevler ve özellikler sağlar, en aza indirin çalışma sayfası sayısı ve daha fazlası.

PDF'yi PowerPoint Sunumlarına Dönüştür

Örnek: C# Kod PDF'den PowerPoint'e Dönüştürme

// PDF belgesini yükle
Document pdfDocument = new Document("document.pdf");
PptxSaveOptions pptxOptions = new PptxSaveOptions();
pptxOptions.setSlidesAsImages(true);
// Çıktı dosyasını kaydet
pdfDocument.save("PDF to PPT.pptx", pptxOptions);

.NET PDF API, slaytları görüntü olarak oluşturarak seçilebilir metin veya resimlerle PowerPoint Sunum Slaytlarına PDF sayfalarını dönüştürmeyi destekler. PowerPoint’e Taşınabilir Belge Biçimini kaydetme deseni hemen hemen aynıdır, Dosyayı Document sınıfını kullanarak yükleme ve ardından çıktı dosyası yolu ve SaveFormat ile Kaydet yöntemini parametre olarak çağırma. Özel sunum seçenekleriyle oluşturma durumunda, Programcılar ilgili belirli oluşturma seçenekleriyle PPTxSaveOptions sınıfı kullanabilir. Kaydetme yöntemini çağırmak ve seçenekleri parametre olarak geçirmek.

Taşınabilir Belge Formatı PDF'den HTML'ye Dönüştür

Örnek: PDF'den HTML'ye Dönüştürme için C# Kodu

// Kaynak PDF belgesini yükle
Document doc = new Document("source-input-file.pdf");

// HTML kaydetme seçenekleri nesnesini başlatma
HtmlSaveOptions conversionOptions = new HtmlSaveOptions();

// HTML içindeki tüm kaynakları gömmek için seçeneği etkinleştirme
conversionOptions.PartsEmbeddingMode = HtmlSaveOptions.PartsEmbeddingModes.EmbedAllIntoHtml;

// PDF'den HTML'ye Görüntülerle ayrı klasör belirleme
conversionOptions.SpecialFolderForAllImages = "ImagesFolder";

// Ortaya çıkan HTML için birden çok sayfaya bölme seçeneğini belirleme
conversionOptions.setSplitIntoPages(true);

doc.save("converted-pdf-to.html", conversionOptions);

PDF Ayrıştırma Kitaplığı, PDF’yi HTML’ye kaydetmenin yanı sıra görüntüler de dahil olmak üzere gömülü kaynaklarla da destekler. Dönüştürme prosedürü, kaynak belgeyi yüklemek ve çıktı HTML dosya yolu ve SaveFormat.Html ile Kaydet yöntemini parametre olarak çağırmak gibi genel durumlar için diğer biçimlere PDF ile aynıdır. Gömülü kaynaklarla kaydetme durumunda, dönüştürme sırasında görüntüleri belirli bir klasöre kaydetme, elde edilen HTML’yi birden çok sayfaya bölme ve daha fazlası gibi birden çok seçeneğe sahip bir HTMLSaveOptions sınıfı vardır.

PDF'yi Görüntülere Dönüştür

Örnek: PDF'den Görüntülere dönüştürme için C# Kodu

// Belgeyi yükle
Document srcFile = new Document("pdf-pages-to-image.pdf");

java.io.OutputStream outputBinImageFile = new java.io.FileOutputStream(
                    _dataDir + "image" + pageCount + "_out." + ext);

// Çözünürlük nesnesi oluşturma
Resolution resolution = new Resolution(300);

// Belirtilen niteliklere sahip Görüntü aygıtı oluştur
// Genişlik, Yükseklik, Çözünürlük
JpegDevice renderToImages = new JpegDevice(500, 700, resolution);
// BMP, PNG, TIFF için sırasıyla BMPDevice, PngDevice, TiffDevice olacaktır

// Belirli bir sayfayı dönüştürün ve görüntüyü akışa kaydedin
renderToImages.Process(srcFile.Pages[1], outputBinImageFile);

// Akışı kapat
outputBinImageFile.Close();

PDF sayfalarını PNG, JPEG, TIFF, BMP vb. Dahil olmak üzere görüntülere dönüştürmek, aşağıda listelenen kod parçacıklarını kullanarak .NET tabanlı uygulamalarda kolaydır. Geliştiriciler dosyayı yükledikten sonra PDF sayfaları arasında döngü yapabilir ve Sayfayı Sayfayı gerekli görüntü formatına dönüştürebilir. Geliştiriciler, Çözünürlük sınıfı kullanarak görüntülerin yatay ve dikey çözünürlüğünü ayarlayabilir