Python for .NET aracılığıyla PDF Biçimi Dönüştürücü

PDF’yi Microsoft Office® Word, Excel, PowerPoint Sunumları, Görüntüler, HTML ve sabit düzen biçimlerine aktarın

Genel bakış

Ayrıştırma verilerini PDF formatlarında sunarken, PDF dışındaki belgeleri değiştirmeye ihtiyaç duyulduğunda birkaç durum vardır. Dolayısıyla, bu tür uygulamalar için ya kendi çözümlerinde PDF ayrıştırma işlevselliği ekleyecekleri ya da desteklenen formatlar itibariyle verileri işlemek için PDF dönüştürme işlevini ekleyecekleri iki senaryo olacaktır. İkinci senaryo için** PDF’yi Word**, Excel, HTML, Görüntüler veya gerekli herhangi bir formata dönüştürün, .NET tabanlı içinde** C# PDF okuyucu ve dönüştürücü** kodunu uygulamak basittir. Programcıların bu dönüşüm kodu parçacıklarını gereksinimleri doğrultusunda değiştirebilmeleri için burada birkaç durumu tartışıyoruz..

PDF'den Microsoft Word 2003-2019'a Dönüşüm

Örnek: PDF'den Word'e Dönüştürme için C# Kodu

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_doc.doc"

// Kaynak PDF Dosyasını Yükle
document = ap.Document(input_pdf)

// Kaydet seçeneklerini kullanarak kaydetme
// DocSaveOptions nesnesi oluşturma
 save_options = ap.DocSaveOptions()
save_options.format = ap.DocSaveOptions.DocFormat.DOCX

// Tanıma modunu Akış anlamına gelir Tam tanıma modu olarak ayarlayın
save_options.mode = ap.DocSaveOptions.RecognitionMode.FLOW

// Diğer iki mod RecognitionMode.textbox ve RecognitionMode.enhancedFlow

// Yatay yakınlığı 2,5 olarak ayarlayın
save_options.relative_horizontal_proximity = 2.5

// Dönüştürme işlemi sırasında madde işaretlerini tanımak için değeri etkinleştirin
save_options.recognize_bullets = True

// Ortaya çıkan DOC dosyasını kaydedin
document.save(output_pdf, save_options)

.NET kütüphanesi için Aspose.PDF, tüm PDF’den Word’e dönüşümleri destekler. Microsoft Word belgelerini herhangi bir özel ayar olmadan dönüştürüyorsak, PDF dosyasını Document sınıfından Kaydet yöntemini kullanarak yüklüyoruz ve çıktı Word belge yolu ve SaveFormat parametreleri olarak kullanacağız. Hat mesafesini, görüntü çözünürlüğünü ve daha fazla ayarı geliştirmeye ihtiyaç duyulan özel durumlar için API, tüm bu ayarları ortaya çıkaran DocSaveOptions sınıfına sahiptir.

PDF'yi Excel Dosyaları Olarak Kaydet

PDF'yi Excel Dosyaları Olarak Kaydet

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_excel.xlsx"
// PDF belgesini yükle
document = ap.Document(input_pdf)
// ExcelSaveOptions'i Başlat
save_option = ap.ExcelSaveOptions()
// Çıktı Excel XLSX formatını ayarla
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
// Çalışma Sayfası sayısını en aza indirin
save_option.minimize_the_number_of_worksheets = True
// PDF'yi Excel çıktı dosyasına dönüştürün
document.save(output_pdf, save_option)

Özel SaveFormat.excel PDF’yi belirli Microsoft Excel XLS XLSX çıktı biçimlerine kaydetmek için numaralandırma mevcuttur. Ayrıca, .NET PDF Library da var speicific ExcelSaveOptions sınıfı sadece Excel formatlarına kaydetmekle kalmaz, aynı zamanda tam çıktı formatı gibi farklı nitelikleri ayarlamak için farklı işlevler ve özellikler sağlar, en aza indirin çalışma sayfası sayısı ve daha fazlası.

PDF'yi PowerPoint Sunumlarına Dönüştür

Örnek: C# Kod PDF'den PowerPoint'e Dönüştürme

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_pptx.pptx
// PDF belgesini yükle
document = ap.Document(input_pdf)
save_option = ap.PptxSaveOptions()
save_option.slides_as_images = True
// Çıktı dosyasını kaydet
document.save(output_pdf, save_option)

.NET PDF API, slaytları görüntü olarak oluşturarak seçilebilir metin veya resimlerle PowerPoint Sunum Slaytlarına PDF sayfalarını dönüştürmeyi destekler. PowerPoint’e Taşınabilir Belge Biçimini kaydetme deseni hemen hemen aynıdır, Dosyayı Document sınıfını kullanarak yükleme ve ardından çıktı dosyası yolu ve SaveFormat ile Kaydet yöntemini parametre olarak çağırma. Özel sunum seçenekleriyle oluşturma durumunda, Programcılar ilgili belirli oluşturma seçenekleriyle PPTxSaveOptions sınıfı kullanabilir. Kaydetme yöntemini çağırmak ve seçenekleri parametre olarak geçirmek.

Taşınabilir Belge Formatı PDF'den HTML'ye Dönüştür

Örnek: PDF'den HTML'ye Dönüştürme için C# Kodu

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"

// Kaynak PDF belgesini yükle
document = ap.Document(input_pdf)

// HTML kaydetme seçenekleri nesnesini başlatma
save_options = ap.HtmlSaveOptions()

// HTML içindeki tüm kaynakları gömmek için seçeneği etkinleştirme
save_options.parts_embedding_mode = ap.HtmlSaveOptions.PartsEmbeddingModes.EMBED_ALL_INTO_HTML

// PDF'den HTML'ye Görüntülerle ayrı klasör belirleme
save_options.special_folder_for_all_images = "ImagesFolder"

// Ortaya çıkan HTML için birden çok sayfaya bölme seçeneğini belirleme
save_options.split_into_pages = True

document.save(output_pdf, save_options)

PDF Ayrıştırma Kitaplığı, PDF’yi HTML’ye kaydetmenin yanı sıra görüntüler de dahil olmak üzere gömülü kaynaklarla da destekler. Dönüştürme prosedürü, kaynak belgeyi yüklemek ve çıktı HTML dosya yolu ve SaveFormat.Html ile Kaydet yöntemini parametre olarak çağırmak gibi genel durumlar için diğer biçimlere PDF ile aynıdır. Gömülü kaynaklarla kaydetme durumunda, dönüştürme sırasında görüntüleri belirli bir klasöre kaydetme, elde edilen HTML’yi birden çok sayfaya bölme ve daha fazlası gibi birden çok seçeneğe sahip bir HTMLSaveOptions sınıfı vardır.

PDF'yi Görüntülere Dönüştür

Örnek: PDF'den Görüntülere dönüştürme için C# Kodu

import aspose.pdf as ap

input_pdf = DIR_INPUT + "many_pages.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_jpeg"
imageStream = io.FileIO(output_pdf + "_page_1_out.jpeg", "x")

// Belgeyi yükle
document = ap.Document(input_pdf)

// Çözünürlük nesnesi oluşturma
resolution = ap.devices.Resolution(300)

// Belirtilen niteliklere sahip Görüntü aygıtı oluştur
// Genişlik, Yükseklik, Çözünürlük
device = ap.devices.JpegDevice(resolution)
// BMP, PNG, TIFF için sırasıyla BMPDevice, PngDevice, TiffDevice olacaktır

// Belirli bir sayfayı dönüştürün ve görüntüyü akışa kaydedin
device.process(document.pages[i + 1], imageStream)

// Akışı kapat
imageStream.close()

PDF sayfalarını PNG, JPEG, TIFF, BMP vb. Dahil olmak üzere görüntülere dönüştürmek, aşağıda listelenen kod parçacıklarını kullanarak .NET tabanlı uygulamalarda kolaydır. Geliştiriciler dosyayı yükledikten sonra PDF sayfaları arasında döngü yapabilir ve Sayfayı Sayfayı gerekli görüntü formatına dönüştürebilir. Geliştiriciler, Çözünürlük sınıfı kullanarak görüntülerin yatay ve dikey çözünürlüğünü ayarlayabilir