C++アプリケーションでPDFをCSVにレンダリングする

Microsoft ®ExcelまたはAdobe® Acrobat Readerを必要とせずに、ネイティブC++アプリケーションでPDFをCSVに変換します

 

Aspose.Total for C++ ファイル形式の自動化ライブラリを介してPDFをC++でCSVに変換するのは、単純な2ステップのプロセスです。最初のステップでは、 Aspose.PDF for C++ を使用してPDFをXLSXにエクスポートできます。その後、 Aspose.Cells for C++ スプレッドシートプログラミングAPI、XLSXをCSVに変換できます。

PDFをCSVに変換するC++API

  1. ドキュメント クラスリファレンスを使用してPDFファイルを開きます
  2. Save メンバー関数を使用してPDFをXLSXに変換します
  3. IWorkbook クラスリファレンスを使用してXLSXドキュメントをロードします
  4. Save メンバー関数を使用してドキュメントをCSV形式で保存します

変換要件

コマンドラインからnuget install Aspose.Total.Cppとしてインストールするか、VisualStudioのパッケージマネージャーコンソールからInstall-PackageAspose.Total.Cppを使用してインストールします。

または、 ダウンロード からオフラインMSIインストーラーまたはDLLをZIPファイルで取得します。

// supports PDF, CGM, EPUB, TeX, PCL, PS, SVG, XPS, MD, MHTML, XML, and XSLFO file format
// Load the PDF.
auto doc = MakeObject<Document>(u"sourceFile.pdf");
// Save in XLSX format.
doc->Save(u"XlsxOutput.xlsx", SaveFormat::Xlsx);
// Load the XLSX.
intrusive_ptr<Aspose::Cells::IWorkbook> wkb = Factory::CreateIWorkbook(u"XlsxOutput.xlsx");
// supports CSV, XLSB, XLSM, XLT, XLTX, XLTM, XLAM, TSV, TXT, ODS, DIF, MD, SXC, and FODS file format
// Save in CSV format.
wkb->Save(u"convertedFile.csv", SaveFormat_Csv);

C++を介してPDFファイル情報を取得または設定する

Aspose.PDF for C++ を使用すると、PDFドキュメントに関する情報を取得したり、変換プロセスの前に十分な情報に基づいて決定を下したりすることもできます。 PDFファイルのファイル固有の情報を取得するには、最初に get_Info() メソッドを呼び出す必要があります。 ドキュメント クラス。 DocumentInfoオブジェクトが取得されると、個々のプロパティの値を取得できます。さらに、DocumentInfoクラスのそれぞれのメソッドを使用してプロパティを設定することもできます。

// supports PDF, CGM, EPUB, TeX, PCL, PS, SVG, XPS, MD, MHTML, XML, and XSLFO file format
// load the PDF.
auto doc = MakeObject<Document>(L"DocumentInfo.pdf");
// get document informtion object
info = doc->get_Info();
// set author
info->set_Author(L"John Doe");
// set subject
info->set_Subject(L"Working with Document Info");
// set title
info->set_Title(L"Get/set document's info");
// get and print document information
Console::WriteLine(L"Author: {0}", info->get_Author());
Console::WriteLine(L"Subject: {0}", info->get_Subject());
Console::WriteLine(L"Title: {0}", info->get_Title());

CSVファイル形式をC++経由でストリームに保存

Aspose.Cells for C++ を使用すると、CSVファイル形式をストリーミングに保存できます。ファイルをストリームに保存するには、MemoryStreamまたはFileStreamオブジェクトを作成し、 IWorkbook を呼び出してファイルをそのストリームオブジェクトに保存します。オブジェクトの Save メソッド。 Saveメソッドを呼び出すときに、 SaveFormat 列挙を使用して目的のファイル形式を指定します。

// supports CSV, XLSB, XLSM, XLT, XLTX, XLTM, XLAM, TSV, TXT, ODS, DIF, MD, SXC, and FODS file format
// load sample CSV file
intrusive_ptr<IWorkbook> workbook = Factory::CreateIWorkbook("sampleExcelFile.csv");
// create FileStream object
intrusive_ptr<FileStream> stream = new FileStream("outputSavingFiletoStream.csv"), FileMode_CreateNew);
// save the Workbook to Stream
workbook->Save(stream, SaveFormat_Csv);
// working with stream..

PDF の変換オプションを C++ で探索

PDF を DIF に変換 (データ交換フォーマット)
PDF を DOCM に変換 (Microsoft Word 2007 マルコ ファイル)
PDF を DOTM に変換 (Microsoft Word 2007+ テンプレート ファイル)
PDF を DOTX に変換 (Microsoft Wordテンプレートファイル)
PDF を DOT に変換 (Microsoft Wordテンプレートファイル)
PDF を EXCEL に変換 (スプレッドシートのファイル形式)
PDF を FLATOPC に変換 (Microsoft Word 2003 ワードプロセッサML)
PDF を FODS に変換 (OpenDocument フラット XML スプレッドシート)
PDF を GIF に変換 (グラフィカル交換フォーマット)
PDF を MARKDOWN に変換 (軽量マークアップ言語)
PDF を MD に変換 (マークダウン言語)
PDF を ODP に変換 (OpenDocument プレゼンテーション形式)
PDF を ODS に変換 (OpenDocument スプレッドシート)
PDF を ODT に変換 (OpenDocument テキスト ファイル形式)
PDF を OTP に変換 (OpenDocument標準フォーマット)
PDF を OTT に変換 (OpenDocument テンプレート)
PDF を PCL に変換 (プリンターコマンド言語)
PDF を POTM に変換 (Microsoft PowerPoint テンプレート ファイル)
PDF を POTX に変換 (Microsoft PowerPoint テンプレートのプレゼンテーション)
PDF を POT に変換 (Microsoft PowerPoint テンプレート ファイル)
PDF を POWERPOINT に変換 (プレゼンテーションファイル)
PDF を PPSM に変換 (マクロを有効にしたスライド ショー)
PDF を PPSX に変換 (PowerPoint スライド ショー)
PDF を PPS に変換 (PowerPoint スライド ショー)
PDF を PPTM に変換 (マクロが有効なプレゼンテーション ファイル)
PDF を PPT に変換 (パワーポイントによるプレゼンテーション)
PDF を PS に変換 (ポストスクリプトファイル)
PDF を RTF に変換 (リッチテキスト形式)
PDF を SWF に変換 (ショックウェーブフラッシュムービー)
PDF を SXC に変換 (StarOffice Calc スプレッドシート)
PDF を TSV に変換 (タブ区切りの値)
PDF を TXT に変換 (テキストドキュメント)
PDF を WORDML に変換 (Microsoft Word 2003 ワードプロセッサML)
PDF を XAMLFLOW に変換 (MicrosoftのPower Automate)
PDF を XAML に変換 (XAMLファイル)
PDF を XLAM に変換 (Excel マクロ有効アドイン)
PDF を XLSB に変換 (Excel バイナリ ワークブック)
PDF を XLSM に変換 (マクロが有効なスプレッドシート)
PDF を XLTM に変換 (Excel マクロ有効テンプレート)

PDF ファイル形式とは

PDF (Portable Document Format) は、さまざまなソフトウェア アプリケーション、ハードウェア デバイス、オペレーティング システム間で一貫性を保った方法でドキュメントを表示するために設計されたファイル形式です。各 PDF ファイルには、テキスト、フォント、グラフィックス、および正確な表示に必要なその他の情報を含む、固定レイアウト ドキュメントの包括的な説明が含まれています。 PDF は、1990 年代初頭に Adobe Systems によって最初に開発され、テキストの書式設定やインライン画像を保持しながらコンピュータ ドキュメントを共有する手段として機能しました。

PDF ファイルは、通常、Adobe Acrobat などのソフトウェアや類似の PDF 作成ツールを使用して生成されます。現在、PDF は国際標準化機構 (ISO) によって管理されるオープン標準となっています。この標準化により、さまざまなプラットフォームやシステム間での互換性と相互運用性が確保されます。 PDF ファイルを表示するには、Adobe Reader やその他の PDF ビューアなどの無料ソフトウェアを利用できます。

PDF の大きな利点の 1 つは、プラットフォームに依存しないため、さまざまなデバイスやデバイスでシームレスに表示および印刷できることです。オペレーティングシステム。使用されるハードウェアまたはソフトウェアに関係なく、ドキュメントのレイアウトとコンテンツはそのまま残ります。この普遍的なアクセシビリティにより、さまざまなプラットフォームやシステム間でドキュメントを共有および配布するための推奨形式として PDF が人気を博しました。

テキスト、フォント、グラフィックス、書式設定を含む完全なドキュメントをカプセル化する PDF の機能により、さまざまな用途に信頼できる選択肢です。重要なレポートの共有、電子書籍の出版、フォームの配布、プロフェッショナルなプレゼンテーションの配信など、PDF を使用すると、さまざまな環境にわたって一貫したドキュメントのレンダリングとコンテンツの信頼性の高い保存が保証されます。

CSV ファイル形式とは

CSV (カンマ区切り) ファイルは、スプレッドシートやデータベースに似た表形式のデータを保存するためによく使用される形式です。これはカンマで区切られたデータで構成され、各行がレコードを表します。 CSV ファイルは、Microsoft Notepad や Apple TextEdit などのテキスト エディタだけでなく、Microsoft Excel や Apple Numbers などのスプレッドシート プログラムでも開くことができます。

テキスト エディタで開くと、CSV データは表形式で表示されます。列はカンマで区切られ、各行は改行で区切られます。最初の行はヘッダー行と呼ばれ、列名が含まれています。

CSV ファイルを使用すると、異なるアプリケーション間で簡単にデータを交換できます。 Excel や Numbers などのスプレッドシート プログラムからデータをエクスポートし、CSV 形式で保存できます。同様に、CSV ファイルをこれらのプログラムにインポートすると、あるシステムから別のシステムにデータを転送できます。

CSV ファイルは、そのシンプルで汎用的な構造により、柔軟性と互換性を提供します。これらは、データ移行、プラットフォーム間での情報共有、さまざまなソースからのデータの統合に広く使用されています。 CSV ファイルの単純な性質により、人間とコンピューター システムの両方がデータ操作、分析、処理にアクセスできます。