Konverter Format PDF melalui Aspose.PDF untuk Java

Ekspor PDF ke Microsoft Office® Word, Excel, Presentasi PowerPoint, Gambar, HTML, dan format tata letak tetap

Ringkasan

Ada beberapa kasus ketika ada kebutuhan untuk memanipulasi dokumen selain PDF sementara data penguraian tersedia dalam format PDF. Jadi untuk aplikasi semacam itu akan ada dua skenario baik mereka menambahkan fungsionalitas penguraian PDF dalam solusi mereka sendiri atau menambahkan fungsionalitas konversi PDF untuk memanipulasi data seperti format yang didukung. Untuk skenario kedua untuk mengonversi PDF ke Word, Excel, HTML, Gambar atau format yang diperlukan, mengimplementasikan kode C# PDF reader dan converter dalam berbasis .NET itu sederhana. Kami membahas di sini beberapa kasus sehingga programmer dapat memodifikasi cuplikan kode konversi ini sesuai kebutuhan mereka.

Konversi PDF ke Microsoft Word 2003-2019

Contoh: Kode C# untuk Konversi PDF ke Word

// Muat File PDF sumber
Document pdfFile = new Document("Source-PDF-File.pdf");

// Simpan menggunakan opsi simpan
// Buat objek DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Atur mode pengenalan sebagai Flow berarti Mode pengenalan penuh
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);

// Dua mode lainnya adalah RecognitionMode.TextBox dan RecognitionMode.EnhancedFlow

// Atur jarak Horizontal sebagai 2.5
saveOptions.setRelativeHorizontalProximity(2.5f);

// Aktifkan nilai untuk mengenali peluru selama proses konversi
saveOptions.setRecognizeBullets(true);

// Simpan file DOC yang dihasilkan
pdfDocument.save(docFile.toString(), saveOptions);

Aspose.PDF untuk perpustakaan .NET mendukung semua konversi PDF ke Word. Jika kita hanya mengonversi dokumen Microsoft Word tanpa pengaturan khusus, kita cukup memuat file PDF menggunakan metode Simpan dari kelas Dokumen dan akan menggunakan dengan output jalur dokumen Word dan SaveFormat sebagai parameter. Untuk kasus khusus di mana ada kebutuhan untuk meningkatkan jarak garis, resolusi gambar, dan pengaturan lainnya, API memiliki kelas DocSaveOptions yang memperlihatkan semua pengaturan tersebut.

Simpan PDF sebagai File Excel

Simpan PDF sebagai File Excel

// Muat dokumen PDF
Document pdfDoc = new Document("sample-file.pdf");
// Inisialisasi ExcelSaveOptions
ExcelSaveOptions excelSave = new ExcelSaveOptions();
// Mengatur output format Excel XLSX
excelSave.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// Minimalkan jumlah Lembar Kerja
excelsave.setMinimizeTheNumberOfWorksheets(true);
// Konversi PDF ke file keluaran Excel
pdfDoc.Save("pdf-to-excel-output.xlsx", excelSave);

Khusus SaveFormat.excel Pencacatan tersedia untuk menyimpan PDF ke format output Microsoft Excel XLS XLSX tertentu. Selain itu, .NET PDF Library juga memiliki khusus kelas ExcelSaveOptions yang tidak hanya menangani penyimpanan ke format Excel tetapi juga menyediakan fungsi dan properti yang berbeda untuk mengatur atribut yang berbeda seperti format keluaran yang tepat, meminimalkan jumlah lembar kerja dan banyak lagi.

Konversi PDF ke Presentasi PowerPoint

Contoh: Konversi Kode C# PDF ke PowerPoint

// Muat dokumen PDF
Document pdfDocument = new Document("document.pdf");
PptxSaveOptions pptxOptions = new PptxSaveOptions();
pptxOptions.setSlidesAsImages(true);
// Simpan file keluaran
pdfDocument.save("PDF to PPT.pptx", pptxOptions);

.NET PDF API mendukung konversi halaman PDF ke Slide Presentasi PowerPoint dengan teks atau gambar yang dapat dipilih dengan merender slide sebagai gambar. Pola menyimpan Format Dokumen Portabel ke PowerPoint hampir sama, Memuat file menggunakan kelas Dokumen dan kemudian memanggil metode Save dengan jalur file output dan saveFormat sebagai parameter. Dalam hal rendering dengan opsi presentasi khusus, Pemrogram dapat menggunakan kelas PPTXSaveOptions dengan opsi rendering spesifik yang relevan. Memanggil metode simpan dan meneruskan opsi sebagai parameter.

Format Dokumen Portabel Konversi PDF ke HTML

Contoh: Kode C# untuk Konversi PDF ke HTML

// Muat dokumen PDF sumber
Document doc = new Document("source-input-file.pdf");

// Instantiate HTML Save options object
HtmlSaveOptions conversionOptions = new HtmlSaveOptions();

// Mengaktifkan opsi untuk menyematkan semua sumber daya di dalam HTML
conversionOptions.PartsEmbeddingMode = HtmlSaveOptions.PartsEmbeddingModes.EmbedAllIntoHtml;

// Menentukan folder terpisah untuk PDF ke HTML dengan Gambar
conversionOptions.SpecialFolderForAllImages = "ImagesFolder";

// Menentukan opsi pemisahan untuk HTML yang dihasilkan menjadi beberapa halaman
conversionOptions.setSplitIntoPages(true);

doc.save("converted-pdf-to.html", conversionOptions);

PDF Parsing Library mendukung penyimpanan PDF ke HTML secara keseluruhan serta dengan sumber daya tertanam termasuk gambar. Prosedur konversi sama dengan PDF ke format lain untuk kasus umum, seperti memuat dokumen sumber dan memanggil metode Simpan dengan jalur file HTML keluaran dan SaveFormat.Html sebagai parameter. Dalam hal menyimpan dengan sumber daya tertanam, ada kelas HTMLSaveOptions yang memiliki beberapa opsi seperti menyimpan gambar ke folder tertentu selama konversi, membagi HTML yang dihasilkan menjadi beberapa halaman dan banyak lagi.

Konversi PDF ke Gambar

Contoh: Kode C# untuk konversi PDF ke Gambar

// Muat dokumen
Document srcFile = new Document("pdf-pages-to-image.pdf");

java.io.OutputStream outputBinImageFile = new java.io.FileOutputStream(
                    _dataDir + "image" + pageCount + "_out." + ext);

// Buat objek Resolusi
Resolution resolution = new Resolution(300);

// Buat perangkat Gambar dengan atribut tertentu
// Lebar, Tinggi, Resolusi
JpegDevice renderToImages = new JpegDevice(500, 700, resolution);
// Untuk BMP, PNG, TIFF masing-masing akan menjadi BmpDevice, PngDevice, tiffDevice

// Konversi halaman tertentu dan simpan gambar untuk streaming
renderToImages.Process(srcFile.Pages[1], outputBinImageFile);

// Tutup aliran
outputBinImageFile.Close();

Mengkonversi halaman PDF menjadi gambar termasuk PNG, JPEG, TIFF, BMP dll mudah dalam aplikasi berbasis.NET menggunakan cuplikan kode yang tercantum di bawah ini. Pengembang dapat menelusuri halaman PDF setelah memuat file dan mengonversi Halaman demi Halaman ke format gambar yang diperlukan. Pengembang dapat mengatur resolusi horizontal dan vertikal gambar menggunakan Kelas resolusi