การแปลงเอกสาร PDF ผ่านทาง C++

ส่งออก PDF ไปยัง Microsoft Office® Word, Excel, งานนำเสนอ PowerPoint, รูปภาพ, HTML และรูปแบบเค้าโครงคงที่

ภาพรวม

มีไม่กี่กรณีเมื่อมีความจำเป็นต้องจัดการกับเอกสารอื่น ๆ แล้ว PDF ในขณะที่มีการแยกข้อมูลที่มีอยู่ในรูปแบบ PDF เป็นดังนั้นสำหรับการใช้งานดังกล่าวจะมีสองสถานการณ์ทั้งที่พวกเขาเพิ่มฟังก์ชันการทำงานของการแยกวิเคราะห์ PDF ภายในโซลูชั่นของตัวเองหรือเพิ่มฟังก์ชันการแปลงไฟล์ PDF เพื่อจัดการข้อมูลเป็นรูปแบบที่สนับสนุนสำหรับสถานการณ์ที่สองเพื่อแปลงไฟล์ PDF เป็น Word, Excel, HTML, รูปภาพหรือรูปแบบที่จำเป็นใด ๆ การดำเนินการC# อ่าน PDF และแปลง รหัสภายใน .NET ตามเป็นเรื่องง่ายเราจะคุยที่นี่ไม่กี่กรณีเพื่อให้โปรแกรมเมอร์สามารถปรับเปลี่ยนข้อมูลโค้ดแปลงเหล่านี้เป็นความต้องการของพวกเขา

รูปแบบไฟล์ PDF เป็น Microsoft Word 2003-2019 การแปลงไฟล์

ตัวอย่าง: รหัส C# สำหรับการแปลงไฟล์ PDF เป็น Word

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToDOC.doc")

// โหลดไฟล์ PDF ต้นฉบับ
auto document = MakeObject<Document>(_dataDir + infilename);

// บันทึกโดยใช้ตัวเลือกการบันทึก
// สร้างวัตถุ DocSaveOptions
auto saveOptions = MakeObject<DocSaveOptions>();

// ตั้งค่าโหมดการรับรู้เป็น Flow หมายถึงโหมดการรับรู้แบบเต็ม
saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
// อีกสองโหมดเป็น recognitionMode.TextBox และ การรับรู้Mode.EnhancedFlow

// ตั้งค่าความใกล้ชิดแนวนอนเป็น 2.5
saveOptions->set_RelativeHorizontalProximity(2.5f);

// เปิดใช้งานค่าที่จะรับรู้สัญลักษณ์แสดงหัวข้อย่อยในระหว่างกระบวนการแปลง
saveOptions->set_RecognizeBullets(true);

// บันทึกไฟล์ DOC ผลลัพธ์
document->Save(_dataDir + outfilename, saveOptions);

Aspose.PDF สำหรับไลบรารี .NET สนับสนุนไฟล์ PDF ทั้งหมดเพื่อแปลง Wordในกรณีที่เราเป็นเพียงการแปลงเอกสาร Microsoft Word โดยไม่ต้องตั้งค่าพิเศษใด ๆ เราเพียงแค่โหลดไฟล์ PDF โดยใช้วิธีการบันทึกจากชั้นเอกสารและจะใช้กับเส้นทางเอกสาร Word เอาท์พุทและ SaveFormat เป็นพารามิเตอร์สำหรับกรณีพิเศษที่มีความจำเป็นเพื่อเพิ่มระยะทางเส้นความละเอียดของภาพและการตั้งค่าอื่น ๆ API มีระดับ DocSaveOptions ที่เปิดเผยการตั้งค่าดังกล่าวทั้งหมด

บันทึก PDF เป็นไฟล์ Excel

บันทึก PDF เป็นไฟล์ Excel

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToExcel.xlsx");
// โหลดเอกสาร PDF
auto document = MakeObject<Document>(_dataDir + infilename);
// เริ่มต้นตัวเลือก ExcelSaveOptions
auto excelSave = MakeObject<ExcelSaveOptions>();
// ตั้งค่ารูปแบบการส่งออกของ Excel XLSX
excelSave->set_Format(ExcelSaveOptions::ExcelFormat::XLSX);
// ลดจำนวนแผ่นงาน
excelSave->set_MinimizeTheNumberOfWorksheets(true);
// แปลงไฟล์ PDF เป็นไฟล์เอาท์พุท Excel
document->Save(outfilename, excelSave);

เฉพาะ SaveFormat.excel การแจงนับใช้ได้สำหรับการบันทึกไฟล์ PDF ไปยังรูปแบบการส่งออก XLS XLSX ของ Microsoft Excel ที่เฉพาะเจาะจงนอกจากนี้**.NET PDF Library** ยังมี speicific ExcelSaveOptions class ที่ไม่เพียง แต่ข้อเสนอการบันทึกไปยังรูปแบบ Excel แต่ยังมีฟังก์ชั่นที่แตกต่างกันและคุณสมบัติสำหรับการตั้งค่าแอตทริบิวต์ที่แตกต่างกันเช่นรูปแบบการส่งออกที่แน่นอนลดจำนวนแผ่นงานและอื่น ๆ

แปลงไฟล์ PDF เป็นงานนำเสนอ PowerPoint

ตัวอย่าง: C# รหัส PDF เพื่อการแปลง PowerPoint

// String for path name
String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample-pptx.pdf");
String outfilename("sample-pptx.pptx");
// โหลดเอกสาร PDF
Document pdfDocument = new Document("document.pdf");
auto pptxOptions = MakeObject<PptxSaveOptions>();
pptxOptions->set_SlidesAsImages(true);
// บันทึกแฟ้มที่ส่งออก
document->Save(_dataDir + outfilename, pptxOptions);

.NET PDF API สนับสนุนการแปลงหน้า PDF เพื่อนำเสนอสไลด์ PowerPoint ด้วยข้อความที่เลือกหรือภาพโดยการแสดงผลภาพนิ่งเป็นภาพรูปแบบของการประหยัดรูปแบบเอกสารแบบพกพาไปยัง PowerPoint เกือบจะเหมือนกันโหลดไฟล์โดยใช้ระดับเอกสารแล้วเรียกวิธีการบันทึกด้วยเส้นทางไฟล์ที่ส่งออกและ SaveFormat เป็นพารามิเตอร์ในกรณีของการแสดงผลที่มีตัวเลือกการนำเสนอพิเศษ, โปรแกรมเมอร์สามารถใช้ ระดับ PPTXSaveOptions กับตัวเลือกการแสดงผลที่เฉพาะเจาะจงใด ๆ ที่เกี่ยวข้องเรียกวิธีการบันทึกและผ่านตัวเลือกเป็นพารามิเตอร์

รูปแบบเอกสารแบบพกพารูปแบบ PDF เป็น HTML แปลง

ตัวอย่าง: รหัส C# สำหรับการแปลงไฟล์ PDF เป็น HTML

String _dataDir("C:\\Samples\\Conversion\\");
String infilename("sample.pdf");
String outfilename("PDFToHTML.html")

// โหลดเอกสาร PDF ต้นฉบับ
auto document = MakeObject<Document>(_dataDir + infilename);

// อินสแตนซ์วัตถุ HTML บันทึกตัวเลือก
auto htmlOptions = MakeObject<HtmlSaveOptions>();

// การระบุโฟลเดอร์แยกต่างหากสำหรับ PDF เป็น HTML พร้อมรูปภาพ
htmlOptions->SpecialFolderForAllImages = (_dataDir + String("\\images\\"));

// ระบุตัวเลือกการแยกสำหรับ HTML ผลลัพธ์ลงในหลายหน้า
htmlOptions->set_SplitIntoPages(true);

document->Save(_dataDir + outfilename, htmlOptions);

PDF Parsing Library สนับสนุนการบันทึก PDF เป็น HTML โดยรวมเช่นเดียวกับทรัพยากรที่ฝังตัวรวมทั้งภาพขั้นตอนของการแปลงเป็นเช่นเดียวกับ PDF เป็นรูปแบบอื่น ๆ สำหรับกรณีทั่วไปเช่นการโหลดเอกสารต้นฉบับและเรียกวิธีการบันทึกด้วยเส้นทางไฟล์ที่ส่งออก HTML และ SaveFormat.Html เป็นพารามิเตอร์ในกรณีของการประหยัดกับทรัพยากรที่ฝังตัวมี ระดับ HtmlSaveOptions มีหลายตัวเลือกเช่นการบันทึกภาพไปยังโฟลเดอร์เฉพาะในระหว่างการแปลงแยก HTML ผลลัพธ์ลงในหลายหน้าและอื่น ๆ

แปลงไฟล์ PDF เป็นรูปภาพ

ตัวอย่าง: รหัส C# สำหรับการแปลงไฟล์ PDF เป็นรูปภาพ

// โหลดเอกสาร
auto document = MakeObject<Document>(_dataDir + u"ConvertAllPagesToBmp.pdf");

// สร้างวัตถุความละเอียด
 auto resolution = MakeObject<Aspose::Pdf::Devices::Resolution>(300); //300 dpi

// สร้างอุปกรณ์ภาพที่มีแอตทริบิวต์ที่ระบุ
// ความกว้าง, ความสูง, ความละเอียด
System::SmartPtr<Aspose::Pdf::Devices::ImageDevice>
    jpegDevice = MakeObject<Aspose::Pdf::Devices::JpegDevice>(resolution);
// สำหรับ BMP, PNG, TIFF จะเป็น BMPDevice, PNGDevice, TiffDevice ตามลำดับ

// แปลงหน้าใดหน้าหนึ่งและบันทึกภาพเพื่อสตรีม
jpegDevice->Process(document->get_Pages()->idx_get(1), imageStream);

// ปิดสตรีม
imageStream->Close();

แปลงหน้า PDF เป็นภาพรวมทั้ง PNG, JPEG, TIFF, BMP ฯลฯ เป็นเรื่องง่ายในการใช้งานตาม .NET โดยใช้ข้อมูลโค้ดที่ระบุไว้ด้านล่างนักพัฒนาสามารถวนผ่านหน้า PDF หลังจากโหลดไฟล์และแปลงหน้าโดยหน้าเป็นรูปแบบภาพที่ต้องการผู้พัฒนาสามารถตั้งค่าความละเอียดขอบฟ้าและแนวตั้งของภาพโดยใช้ ระดับความละเอียด