ตัวแปลงรูปแบบ PDF ผ่าน C++

ส่งออก PDF ไปยัง Microsoft Office® Word, Excel, งานนำเสนอ PowerPoint, รูปภาพ, HTML และรูปแบบเค้าโครงคงที่

ภาพรวม

มีบางกรณีที่จำเป็นต้องจัดการเอกสารอื่นนอกเหนือจาก PDF ในขณะที่มีข้อมูลการแยกวิเคราะห์ในรูปแบบ PDFดังนั้นสำหรับแอปพลิเคชันดังกล่าวจะมีสองสถานการณ์ไม่ว่าจะเป็นการเพิ่มฟังก์ชันการวิเคราะห์ไฟล์ PDF ภายในโซลูชันของตนเองหรือเพิ่มฟังก์ชันการแปลง PDF เพื่อจัดการข้อมูลตามรูปแบบที่รองรับสำหรับสถานการณ์ที่สองเพื่อแปลง PDF เป็น Word, Excel, HTML, รูปภาพ หรือรูปแบบที่จำเป็น การใช้โปรแกรมอ่าน PDF C# และตัวแปลงรหัส ภายใน .NET เป็นเรื่องง่ายเรากำลังพูดถึงบางกรณีที่นี่เพื่อให้โปรแกรมเมอร์สามารถแก้ไขตัวอย่างโค้ดการแปลงเหล่านี้ตามความต้องการของพวกเขา

รูปแบบไฟล์ PDF เป็น Microsoft Word 2003-2019 การแปลงไฟล์

ตัวอย่าง: รหัส C# สำหรับการแปลงไฟล์ PDF เป็น Word

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToDOC.doc")

// โหลดไฟล์ PDF ต้นฉบับ
auto document = MakeObject<Document>(_dataDir + infilename);

// บันทึกโดยใช้ตัวเลือกการบันทึก
// สร้างวัตถุ DocSaveOptions
auto saveOptions = MakeObject<DocSaveOptions>();

// ตั้งค่าโหมดการรับรู้เป็น Flow หมายถึงโหมดการรับรู้แบบเต็ม
saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
// อีกสองโหมดเป็น recognitionMode.TextBox และ การรับรู้Mode.EnhancedFlow

// ตั้งค่าความใกล้ชิดแนวนอนเป็น 2.5
saveOptions->set_RelativeHorizontalProximity(2.5f);

// เปิดใช้งานค่าที่จะรับรู้สัญลักษณ์แสดงหัวข้อย่อยในระหว่างกระบวนการแปลง
saveOptions->set_RecognizeBullets(true);

// บันทึกไฟล์ DOC ผลลัพธ์
document->Save(_dataDir + outfilename, saveOptions);

Aspose.PDF สำหรับไลบรารี .NET สนับสนุนไฟล์ PDF ทั้งหมดเพื่อแปลง Wordในกรณีที่เราเป็นเพียงการแปลงเอกสาร Microsoft Word โดยไม่ต้องตั้งค่าพิเศษใด ๆ เราเพียงแค่โหลดไฟล์ PDF โดยใช้วิธีการบันทึกจากชั้นเอกสารและจะใช้กับเส้นทางเอกสาร Word เอาท์พุทและ SaveFormat เป็นพารามิเตอร์สำหรับกรณีพิเศษที่มีความจำเป็นเพื่อเพิ่มระยะทางเส้นความละเอียดของภาพและการตั้งค่าอื่น ๆ API มีระดับ DocSaveOptions ที่เปิดเผยการตั้งค่าดังกล่าวทั้งหมด

บันทึก PDF เป็นไฟล์ Excel

บันทึก PDF เป็นไฟล์ Excel

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToExcel.xlsx");
// โหลดเอกสาร PDF
auto document = MakeObject<Document>(_dataDir + infilename);
// เริ่มต้นตัวเลือก ExcelSaveOptions
auto excelSave = MakeObject<ExcelSaveOptions>();
// ตั้งค่ารูปแบบการส่งออกของ Excel XLSX
excelSave->set_Format(ExcelSaveOptions::ExcelFormat::XLSX);
// ลดจำนวนแผ่นงาน
excelSave->set_MinimizeTheNumberOfWorksheets(true);
// แปลงไฟล์ PDF เป็นไฟล์เอาท์พุท Excel
document->Save(outfilename, excelSave);

เฉพาะ SaveFormat.excel การแจงนับใช้ได้สำหรับการบันทึกไฟล์ PDF ไปยังรูปแบบการส่งออก XLS XLSX ของ Microsoft Excel ที่เฉพาะเจาะจงนอกจากนี้**.NET PDF Library** ยังมี speicific ExcelSaveOptions class ที่ไม่เพียง แต่ข้อเสนอการบันทึกไปยังรูปแบบ Excel แต่ยังมีฟังก์ชั่นที่แตกต่างกันและคุณสมบัติสำหรับการตั้งค่าแอตทริบิวต์ที่แตกต่างกันเช่นรูปแบบการส่งออกที่แน่นอนลดจำนวนแผ่นงานและอื่น ๆ

แปลงไฟล์ PDF เป็นงานนำเสนอ PowerPoint

ตัวอย่าง: C# รหัส PDF เพื่อการแปลง PowerPoint

// String for path name
String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample-pptx.pdf");
String outfilename("sample-pptx.pptx");
// โหลดเอกสาร PDF
Document pdfDocument = new Document("document.pdf");
auto pptxOptions = MakeObject<PptxSaveOptions>();
pptxOptions->set_SlidesAsImages(true);
// บันทึกแฟ้มที่ส่งออก
document->Save(_dataDir + outfilename, pptxOptions);

.NET PDF API สนับสนุนการแปลงหน้า PDF เพื่อนำเสนอสไลด์ PowerPoint ด้วยข้อความที่เลือกหรือภาพโดยการแสดงผลภาพนิ่งเป็นภาพรูปแบบของการประหยัดรูปแบบเอกสารแบบพกพาไปยัง PowerPoint เกือบจะเหมือนกันโหลดไฟล์โดยใช้ระดับเอกสารแล้วเรียกวิธีการบันทึกด้วยเส้นทางไฟล์ที่ส่งออกและ SaveFormat เป็นพารามิเตอร์ในกรณีของการแสดงผลที่มีตัวเลือกการนำเสนอพิเศษ, โปรแกรมเมอร์สามารถใช้ ระดับ PPTXSaveOptions กับตัวเลือกการแสดงผลที่เฉพาะเจาะจงใด ๆ ที่เกี่ยวข้องเรียกวิธีการบันทึกและผ่านตัวเลือกเป็นพารามิเตอร์

รูปแบบเอกสารแบบพกพารูปแบบ PDF เป็น HTML แปลง

ตัวอย่าง: รหัส C# สำหรับการแปลงไฟล์ PDF เป็น HTML

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToHTML.html")

// โหลดเอกสาร PDF ต้นฉบับ
auto document = MakeObject<Document>(_dataDir + infilename);

// อินสแตนซ์วัตถุ HTML บันทึกตัวเลือก
auto htmlOptions = MakeObject<HtmlSaveOptions>();

// การระบุโฟลเดอร์แยกต่างหากสำหรับ PDF เป็น HTML พร้อมรูปภาพ
htmlOptions->SpecialFolderForAllImages = (_dataDir + String("\\images\\"));

// ระบุตัวเลือกการแยกสำหรับ HTML ผลลัพธ์ลงในหลายหน้า
htmlOptions->set_SplitIntoPages(true);

document->Save(_dataDir + outfilename, htmlOptions);

PDF Parsing Library สนับสนุนการบันทึก PDF เป็น HTML โดยรวมเช่นเดียวกับทรัพยากรที่ฝังตัวรวมทั้งภาพขั้นตอนของการแปลงเป็นเช่นเดียวกับ PDF เป็นรูปแบบอื่น ๆ สำหรับกรณีทั่วไปเช่นการโหลดเอกสารต้นฉบับและเรียกวิธีการบันทึกด้วยเส้นทางไฟล์ที่ส่งออก HTML และ SaveFormat.Html เป็นพารามิเตอร์ในกรณีของการประหยัดกับทรัพยากรที่ฝังตัวมี ระดับ HtmlSaveOptions มีหลายตัวเลือกเช่นการบันทึกภาพไปยังโฟลเดอร์เฉพาะในระหว่างการแปลงแยก HTML ผลลัพธ์ลงในหลายหน้าและอื่น ๆ

แปลงไฟล์ PDF เป็นรูปภาพ

ตัวอย่าง: รหัส C# สำหรับการแปลงไฟล์ PDF เป็นรูปภาพ

// โหลดเอกสาร
auto document = MakeObject<Document>(_dataDir + u"ConvertAllPagesToBmp.pdf");

// สร้างวัตถุความละเอียด
 auto resolution = MakeObject<Aspose::Pdf::Devices::Resolution>(300); //300 dpi

// สร้างอุปกรณ์ภาพที่มีแอตทริบิวต์ที่ระบุ
// ความกว้าง, ความสูง, ความละเอียด
System::SmartPtr<Aspose::Pdf::Devices::ImageDevice>
    jpegDevice = MakeObject<Aspose::Pdf::Devices::JpegDevice>(resolution);
// สำหรับ BMP, PNG, TIFF จะเป็น BmpDevice, PngDevice, TiffDevice ตามลำดับ

// แปลงหน้าใดหน้าหนึ่งและบันทึกภาพเพื่อสตรีม
jpegDevice->Process(document->get_Pages()->idx_get(1), imageStream);

// ปิดสตรีม
imageStream->Close();

แปลงหน้า PDF เป็นภาพรวมทั้ง PNG, JPEG, TIFF, BMP ฯลฯ เป็นเรื่องง่ายในการใช้งานตาม .NET โดยใช้ข้อมูลโค้ดที่ระบุไว้ด้านล่างนักพัฒนาสามารถวนผ่านหน้า PDF หลังจากโหลดไฟล์และแปลงหน้าโดยหน้าเป็นรูปแบบภาพที่ต้องการผู้พัฒนาสามารถตั้งค่าความละเอียดขอบฟ้าและแนวตั้งของภาพโดยใช้ ระดับความละเอียด