Konverter Format PDF melalui Aspose.PDF untuk C++

Ekspor PDF ke Microsoft Office® Word, Excel, Presentasi PowerPoint, Gambar, HTML, dan format tata letak tetap

Ringkasan

Ada beberapa kasus ketika ada kebutuhan untuk memanipulasi dokumen selain PDF sementara data penguraian tersedia dalam format PDF. Jadi untuk aplikasi semacam itu akan ada dua skenario baik mereka menambahkan fungsionalitas penguraian PDF dalam solusi mereka sendiri atau menambahkan fungsionalitas konversi PDF untuk memanipulasi data seperti format yang didukung. Untuk skenario kedua untuk mengonversi PDF ke Word, Excel, HTML, Gambar atau format yang diperlukan, mengimplementasikan kode C# PDF reader dan converter dalam berbasis .NET itu sederhana. Kami membahas di sini beberapa kasus sehingga programmer dapat memodifikasi cuplikan kode konversi ini sesuai kebutuhan mereka.

Konversi PDF ke Microsoft Word 2003-2019

Contoh: Kode C# untuk Konversi PDF ke Word

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToDOC.doc")

// Muat File PDF sumber
auto document = MakeObject<Document>(_dataDir + infilename);

// Simpan menggunakan opsi simpan
// Buat objek DocSaveOptions
auto saveOptions = MakeObject<DocSaveOptions>();

// Atur mode pengenalan sebagai Flow berarti Mode pengenalan penuh
saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
// Dua mode lainnya adalah RecognitionMode.TextBox dan RecognitionMode.EnhancedFlow

// Atur jarak Horizontal sebagai 2.5
saveOptions->set_RelativeHorizontalProximity(2.5f);

// Aktifkan nilai untuk mengenali peluru selama proses konversi
saveOptions->set_RecognizeBullets(true);

// Simpan file DOC yang dihasilkan
document->Save(_dataDir + outfilename, saveOptions);

Aspose.PDF untuk perpustakaan .NET mendukung semua konversi PDF ke Word. Jika kita hanya mengonversi dokumen Microsoft Word tanpa pengaturan khusus, kita cukup memuat file PDF menggunakan metode Simpan dari kelas Dokumen dan akan menggunakan dengan output jalur dokumen Word dan SaveFormat sebagai parameter. Untuk kasus khusus di mana ada kebutuhan untuk meningkatkan jarak garis, resolusi gambar, dan pengaturan lainnya, API memiliki kelas DocSaveOptions yang memperlihatkan semua pengaturan tersebut.

Simpan PDF sebagai File Excel

Simpan PDF sebagai File Excel

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToExcel.xlsx");
// Muat dokumen PDF
auto document = MakeObject<Document>(_dataDir + infilename);
// Inisialisasi ExcelSaveOptions
auto excelSave = MakeObject<ExcelSaveOptions>();
// Mengatur output format Excel XLSX
excelSave->set_Format(ExcelSaveOptions::ExcelFormat::XLSX);
// Minimalkan jumlah Lembar Kerja
excelSave->set_MinimizeTheNumberOfWorksheets(true);
// Konversi PDF ke file keluaran Excel
document->Save(outfilename, excelSave);

Khusus SaveFormat.excel Pencacatan tersedia untuk menyimpan PDF ke format output Microsoft Excel XLS XLSX tertentu. Selain itu, .NET PDF Library juga memiliki khusus kelas ExcelSaveOptions yang tidak hanya menangani penyimpanan ke format Excel tetapi juga menyediakan fungsi dan properti yang berbeda untuk mengatur atribut yang berbeda seperti format keluaran yang tepat, meminimalkan jumlah lembar kerja dan banyak lagi.

Konversi PDF ke Presentasi PowerPoint

Contoh: Konversi Kode C# PDF ke PowerPoint

// String for path name
String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample-pptx.pdf");
String outfilename("sample-pptx.pptx");
// Muat dokumen PDF
Document pdfDocument = new Document("document.pdf");
auto pptxOptions = MakeObject<PptxSaveOptions>();
pptxOptions->set_SlidesAsImages(true);
// Simpan file keluaran
document->Save(_dataDir + outfilename, pptxOptions);

.NET PDF API mendukung konversi halaman PDF ke Slide Presentasi PowerPoint dengan teks atau gambar yang dapat dipilih dengan merender slide sebagai gambar. Pola menyimpan Format Dokumen Portabel ke PowerPoint hampir sama, Memuat file menggunakan kelas Dokumen dan kemudian memanggil metode Save dengan jalur file output dan saveFormat sebagai parameter. Dalam hal rendering dengan opsi presentasi khusus, Pemrogram dapat menggunakan kelas PPTXSaveOptions dengan opsi rendering spesifik yang relevan. Memanggil metode simpan dan meneruskan opsi sebagai parameter.

Format Dokumen Portabel Konversi PDF ke HTML

Contoh: Kode C# untuk Konversi PDF ke HTML

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToHTML.html")

// Muat dokumen PDF sumber
auto document = MakeObject<Document>(_dataDir + infilename);

// Instantiate HTML Save options object
auto htmlOptions = MakeObject<HtmlSaveOptions>();

// Menentukan folder terpisah untuk PDF ke HTML dengan Gambar
htmlOptions->SpecialFolderForAllImages = (_dataDir + String("\\images\\"));

// Menentukan opsi pemisahan untuk HTML yang dihasilkan menjadi beberapa halaman
htmlOptions->set_SplitIntoPages(true);

document->Save(_dataDir + outfilename, htmlOptions);

PDF Parsing Library mendukung penyimpanan PDF ke HTML secara keseluruhan serta dengan sumber daya tertanam termasuk gambar. Prosedur konversi sama dengan PDF ke format lain untuk kasus umum, seperti memuat dokumen sumber dan memanggil metode Simpan dengan jalur file HTML keluaran dan SaveFormat.Html sebagai parameter. Dalam hal menyimpan dengan sumber daya tertanam, ada kelas HTMLSaveOptions yang memiliki beberapa opsi seperti menyimpan gambar ke folder tertentu selama konversi, membagi HTML yang dihasilkan menjadi beberapa halaman dan banyak lagi.

Konversi PDF ke Gambar

Contoh: Kode C# untuk konversi PDF ke Gambar

// Muat dokumen
auto document = MakeObject<Document>(_dataDir + u"ConvertAllPagesToBmp.pdf");

// Buat objek Resolusi
 auto resolution = MakeObject<Aspose::Pdf::Devices::Resolution>(300); //300 dpi

// Buat perangkat Gambar dengan atribut tertentu
// Lebar, Tinggi, Resolusi
System::SmartPtr<Aspose::Pdf::Devices::ImageDevice>
    jpegDevice = MakeObject<Aspose::Pdf::Devices::JpegDevice>(resolution);
// Untuk BMP, PNG, TIFF masing-masing akan menjadi BmpDevice, PngDevice, tiffDevice

// Konversi halaman tertentu dan simpan gambar untuk streaming
jpegDevice->Process(document->get_Pages()->idx_get(1), imageStream);

// Tutup aliran
imageStream->Close();

Mengkonversi halaman PDF menjadi gambar termasuk PNG, JPEG, TIFF, BMP dll mudah dalam aplikasi berbasis.NET menggunakan cuplikan kode yang tercantum di bawah ini. Pengembang dapat menelusuri halaman PDF setelah memuat file dan mengonversi Halaman demi Halaman ke format gambar yang diperlukan. Pengembang dapat mengatur resolusi horizontal dan vertikal gambar menggunakan Kelas resolusi