C++ 経由の PDF フォーマットコンバーター
PDF を Microsoft Office® Word、Excel、PowerPoint プレゼンテーション、画像、HTML、および固定レイアウト形式にエクスポート
概要
解析データをPDF形式で利用できるようにしながら、PDF以外の文書を操作する必要があるケースはほとんどありません。したがって、そのようなアプリケーションには、独自のソリューション内にPDF解析の機能を追加するか、サポートされている形式のデータを操作するPDF変換機能を追加する2つのシナリオがあります。PDFをWordに変換、Excel、HTML、画像、または必要な形式にする2番目のシナリオでは、C# PDFリーダーおよびコンバーターコードを.NETベースで実装するのは簡単です。ここでは、プログラマがこれらの変換コードスニペットを要件に応じて変更できるように、いくつかのケースについて説明します。
PDF からマイクロソフトワード 2003-2019 への変換
.NET ライブラリ用 Aspose.PDF はすべての PDF から Word への変換をサポートしています。特別な設定を行わずに Microsoft Word ドキュメントを変換するだけの場合は、Document クラスの Save メソッドを使用して PDF ファイルをロードし、出力 Word ドキュメントパスと SaveFormat をパラメータとして使用します。線の距離、画像の解像度などの設定を強化する必要がある特別なケースのために、APIにはそのような設定をすべて公開するDocSaveOptionsクラスがあります。
PDF を Excel ファイルとして保存
特殊な SaveFormat.Excel PDF を特定のマイクロソフトエクセル XLS XLSX 出力フォーマットに保存するための列挙型です。さらに、.NET PDFライブラリには、Excel形式への保存を処理するだけでなく、正確な出力形式、最小化などのさまざまな属性を設定するためのさまざまな関数とプロパティを提供する特定の [ExcelSaveOptionsクラス](https://apireference.aspose.com/pdf/net/aspose.pdf/excelsaveoptions)もあります。ワークシートの数など。
PDF をパワーポイントプレゼンテーションに変換
.NET PDF API では、スライドを画像としてレンダリングすることで、PDF ページを選択可能なテキストまたは画像を含む PowerPoint プレゼンテーションスライドに変換できます。ポータブルドキュメントフォーマットをPowerPointに保存するパターンは、Documentクラスを使用してファイルをロードし、出力ファイルパスとSaveFormatをパラメータとしてSaveメソッドを呼び出すというパターンとほぼ同じです。特別な表示オプションを使用してレンダリングする場合、プログラマは pptxSaveOptions クラス を関連する特定のレンダリングオプションとともに使用できます。save メソッドを呼び出し、オプションをパラメータとして渡します。
ポータブルドキュメントフォーマット PDF から HTML への変換
PDF解析ライブラリは、画像を含む埋め込みリソースだけでなく、PDFからHTMLへの保存もサポートしています。変換の手順は、ソースドキュメントをロードし、出力 HTML ファイルパスと SaveFormat.Html をパラメータとして Save メソッドを呼び出すなど、一般的な場合の PDF から他の形式への変換手順と同じです。埋め込みリソースで保存する場合、HtmlSaveOptions クラス があり、変換中に特定のフォルダーに画像を保存したり、結果のHTMLを複数のページに分割したりするなど、複数のオプションがあります。
PDFを画像に変換
.NETベースのアプリケーションでは、以下のコードスニペットを使用して、PDFページをPNG、JPEG、TIFF、BMPなどの画像に簡単に変換できます。開発者は、ファイルをロードした後にPDFページをループし、ページごとに必要な画像形式に変換できます。開発者は、解像度クラス を使用して画像の水平解像度と垂直解像度を設定できます