C++ aracılığıyla PDF Biçimi Dönüştürücü

PDF’yi Microsoft Office® Word, Excel, PowerPoint Sunumları, Görüntüler, HTML ve sabit düzen biçimlerine aktarın

Genel bakış

Ayrıştırma verilerini PDF formatlarında sunarken, PDF dışındaki belgeleri değiştirmeye ihtiyaç duyulduğunda birkaç durum vardır. Dolayısıyla, bu tür uygulamalar için ya kendi çözümlerinde PDF ayrıştırma işlevselliği ekleyecekleri ya da desteklenen formatlar itibariyle verileri işlemek için PDF dönüştürme işlevini ekleyecekleri iki senaryo olacaktır. İkinci senaryo için** PDF’yi Word**, Excel, HTML, Görüntüler veya gerekli herhangi bir formata dönüştürün, .NET tabanlı içinde** C# PDF okuyucu ve dönüştürücü** kodunu uygulamak basittir. Programcıların bu dönüşüm kodu parçacıklarını gereksinimleri doğrultusunda değiştirebilmeleri için burada birkaç durumu tartışıyoruz..

PDF'den Microsoft Word 2003-2019'a Dönüşüm

Örnek: PDF'den Word'e Dönüştürme için C# Kodu

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToDOC.doc")

// Kaynak PDF Dosyasını Yükle
auto document = MakeObject<Document>(_dataDir + infilename);

// Kaydet seçeneklerini kullanarak kaydetme
// DocSaveOptions nesnesi oluşturma
auto saveOptions = MakeObject<DocSaveOptions>();

// Tanıma modunu Akış anlamına gelir Tam tanıma modu olarak ayarlayın
saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
// Diğer iki mod RecognitionMode.textbox ve RecognitionMode.enhancedFlow

// Yatay yakınlığı 2,5 olarak ayarlayın
saveOptions->set_RelativeHorizontalProximity(2.5f);

// Dönüştürme işlemi sırasında madde işaretlerini tanımak için değeri etkinleştirin
saveOptions->set_RecognizeBullets(true);

// Ortaya çıkan DOC dosyasını kaydedin
document->Save(_dataDir + outfilename, saveOptions);

.NET kütüphanesi için Aspose.PDF, tüm PDF’den Word’e dönüşümleri destekler. Microsoft Word belgelerini herhangi bir özel ayar olmadan dönüştürüyorsak, PDF dosyasını Document sınıfından Kaydet yöntemini kullanarak yüklüyoruz ve çıktı Word belge yolu ve SaveFormat parametreleri olarak kullanacağız. Hat mesafesini, görüntü çözünürlüğünü ve daha fazla ayarı geliştirmeye ihtiyaç duyulan özel durumlar için API, tüm bu ayarları ortaya çıkaran DocSaveOptions sınıfına sahiptir.

PDF'yi Excel Dosyaları Olarak Kaydet

PDF'yi Excel Dosyaları Olarak Kaydet

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToExcel.xlsx");
// PDF belgesini yükle
auto document = MakeObject<Document>(_dataDir + infilename);
// ExcelSaveOptions'i Başlat
auto excelSave = MakeObject<ExcelSaveOptions>();
// Çıktı Excel XLSX formatını ayarla
excelSave->set_Format(ExcelSaveOptions::ExcelFormat::XLSX);
// Çalışma Sayfası sayısını en aza indirin
excelSave->set_MinimizeTheNumberOfWorksheets(true);
// PDF'yi Excel çıktı dosyasına dönüştürün
document->Save(outfilename, excelSave);

Özel SaveFormat.excel PDF’yi belirli Microsoft Excel XLS XLSX çıktı biçimlerine kaydetmek için numaralandırma mevcuttur. Ayrıca, .NET PDF Library da var speicific ExcelSaveOptions sınıfı sadece Excel formatlarına kaydetmekle kalmaz, aynı zamanda tam çıktı formatı gibi farklı nitelikleri ayarlamak için farklı işlevler ve özellikler sağlar, en aza indirin çalışma sayfası sayısı ve daha fazlası.

PDF'yi PowerPoint Sunumlarına Dönüştür

Örnek: C# Kod PDF'den PowerPoint'e Dönüştürme

// String for path name
String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample-pptx.pdf");
String outfilename("sample-pptx.pptx");
// PDF belgesini yükle
Document pdfDocument = new Document("document.pdf");
auto pptxOptions = MakeObject<PptxSaveOptions>();
pptxOptions->set_SlidesAsImages(true);
// Çıktı dosyasını kaydet
document->Save(_dataDir + outfilename, pptxOptions);

.NET PDF API, slaytları görüntü olarak oluşturarak seçilebilir metin veya resimlerle PowerPoint Sunum Slaytlarına PDF sayfalarını dönüştürmeyi destekler. PowerPoint’e Taşınabilir Belge Biçimini kaydetme deseni hemen hemen aynıdır, Dosyayı Document sınıfını kullanarak yükleme ve ardından çıktı dosyası yolu ve SaveFormat ile Kaydet yöntemini parametre olarak çağırma. Özel sunum seçenekleriyle oluşturma durumunda, Programcılar ilgili belirli oluşturma seçenekleriyle PPTxSaveOptions sınıfı kullanabilir. Kaydetme yöntemini çağırmak ve seçenekleri parametre olarak geçirmek.

Taşınabilir Belge Formatı PDF'den HTML'ye Dönüştür

Örnek: PDF'den HTML'ye Dönüştürme için C# Kodu

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToHTML.html")

// Kaynak PDF belgesini yükle
auto document = MakeObject<Document>(_dataDir + infilename);

// HTML kaydetme seçenekleri nesnesini başlatma
auto htmlOptions = MakeObject<HtmlSaveOptions>();

// PDF'den HTML'ye Görüntülerle ayrı klasör belirleme
htmlOptions->SpecialFolderForAllImages = (_dataDir + String("\\images\\"));

// Ortaya çıkan HTML için birden çok sayfaya bölme seçeneğini belirleme
htmlOptions->set_SplitIntoPages(true);

document->Save(_dataDir + outfilename, htmlOptions);

PDF Ayrıştırma Kitaplığı, PDF’yi HTML’ye kaydetmenin yanı sıra görüntüler de dahil olmak üzere gömülü kaynaklarla da destekler. Dönüştürme prosedürü, kaynak belgeyi yüklemek ve çıktı HTML dosya yolu ve SaveFormat.Html ile Kaydet yöntemini parametre olarak çağırmak gibi genel durumlar için diğer biçimlere PDF ile aynıdır. Gömülü kaynaklarla kaydetme durumunda, dönüştürme sırasında görüntüleri belirli bir klasöre kaydetme, elde edilen HTML’yi birden çok sayfaya bölme ve daha fazlası gibi birden çok seçeneğe sahip bir HTMLSaveOptions sınıfı vardır.

PDF'yi Görüntülere Dönüştür

Örnek: PDF'den Görüntülere dönüştürme için C# Kodu

// Belgeyi yükle
auto document = MakeObject<Document>(_dataDir + u"ConvertAllPagesToBmp.pdf");

// Çözünürlük nesnesi oluşturma
 auto resolution = MakeObject<Aspose::Pdf::Devices::Resolution>(300); //300 dpi

// Belirtilen niteliklere sahip Görüntü aygıtı oluştur
// Genişlik, Yükseklik, Çözünürlük
System::SmartPtr<Aspose::Pdf::Devices::ImageDevice>
    jpegDevice = MakeObject<Aspose::Pdf::Devices::JpegDevice>(resolution);
// BMP, PNG, TIFF için sırasıyla BMPDevice, PngDevice, TiffDevice olacaktır

// Belirli bir sayfayı dönüştürün ve görüntüyü akışa kaydedin
jpegDevice->Process(document->get_Pages()->idx_get(1), imageStream);

// Akışı kapat
imageStream->Close();

PDF sayfalarını PNG, JPEG, TIFF, BMP vb. Dahil olmak üzere görüntülere dönüştürmek, aşağıda listelenen kod parçacıklarını kullanarak .NET tabanlı uygulamalarda kolaydır. Geliştiriciler dosyayı yükledikten sonra PDF sayfaları arasında döngü yapabilir ve Sayfayı Sayfayı gerekli görüntü formatına dönüştürebilir. Geliştiriciler, Çözünürlük sınıfı kullanarak görüntülerin yatay ve dikey çözünürlüğünü ayarlayabilir