PDF ファイルをオンラインで解析し、C++ でテキストを抽出します。
強力な C++ ベースの PDF ドキュメント パーサー ユーティリティ アプリケーションを開発します。PDF ドキュメント イメージとテキスト抽出用の C++ コードがリストされています。
オンラインアプリでPDFドキュメントを解析する
- PDF ファイルをアップロードしてインポートし、解析します。
- パーサー アプリのドラッグ アンド ドロップを介してドロップ領域内をクリックして実行します。
- PDF ファイルのサイズとインターネットの速度に応じて、数秒お待ちください。
- ドキュメントを解析するには、「今すぐ解析」ボタンをクリックします。
- 解析されたファイルをダウンロードしてすぐに表示します。
C++ 経由で PDF ファイルを解析する
- C++ プロジェクトにライブラリ参照を追加する
- PDFファイルを読み込む
- TextAbsorberクラスオブジェクトを作成する
- すべてのページの吸収剤を受け入れる
- textAbsorber->get_Textを使用して抽出したテキストを取得し、
C++ コード: PDF ドキュメントのテキスト抽出
C++ で PDF ファイル パーサー アプリケーションを開発する
PDF パーサー アプリまたはユーティリティを開発する必要がありますか?
Aspose.Total for C++
の子 API である
Aspose.PDF for C++
を使用すると、どの Python 開発者でも上記の API コードをドキュメント パーサー アプリケーション内に統合できます。強力な C++ ライブラリを使用すると、テキストだけでなく画像も抽出するドキュメント解析ソリューションをプログラミングできます。さらに、PDF 形式を含む多くの一般的な形式をサポートできます。
パーサー アプリ用の PDF ファイルを処理する C++ ユーティリティ
Aspose.PDF for C++ をシステムにインストールするオプションがあります。ニーズに似たものを選択し、ステップバイステップの指示に従ってください。
- NuGet パッケージ をインストールします。 ドキュメンテーション を参照してください
- Visual Studio IDE内で パッケージ マネージャー コンソール を使用してライブラリをインストールする
システム要求
この C++ ライブラリを使用して、Microsoft Windows、Linux、macOS オペレーティング システム上でソフトウェアを開発できます。
- 32 ビット オペレーティング システム。
- Microsoft Windows デスクトップ (7、8、10)
- 古いバージョンの OS (XP、Vista、Server 2003)
- Microsoft Visual Studio 2017 以降。
Linux または macOS 用のソフトウェアを開発する場合は、
製品ドキュメント
で追加のライブラリ依存関係に関する情報を確認してください。
よくある質問
- 上記の C++ コードをアプリケーションで使用できますか?はい、このコードをダウンロードして、C++ ベースのドキュメント パーサー アプリケーションの開発に活用していただけます。このコードは、ノードの読み取りや、テキストと画像の抽出のためのドキュメントの読み込みなど、バックエンド ドキュメント処理の領域でプロジェクトの機能と能力を強化するための貴重なリソースとして機能します。
- このオンライン ドキュメント パーサー アプリは Windows でのみ動作しますか?Windows、Linux、Mac OS、Android など、どのオペレーティング システムで実行されていても、どのデバイスでもドキュメントの解析を開始できる柔軟性があります。必要なのは、最新の Web ブラウザーとアクティブなインターネット接続だけです。
- PDF ドキュメントを解析するためにオンライン アプリを使用するのは安全ですか?もちろんです! 当社のサービスを通じて生成された出力ファイルは、24 時間以内に当社サーバーから安全かつ自動的に削除されます。その結果、これらのファイルに関連付けられた表示リンクは、この期間を過ぎると機能しなくなります。
- アプリを使用するにはどのブラウザが必要ですか?オンライン PDF ドキュメント パーサーには、Google Chrome、Firefox、Opera、Safari などの最新の Web ブラウザーを使用できます。ただし、デスクトップ アプリケーションを開発している場合は、効率的な管理のために Aspose.Total ドキュメント処理 API を使用することをお勧めします。
探検ファイルパーサー C++ のオプション
解析する DOC ファイル」
(Microsoft Wordバイナリ形式)
解析する DOCX ファイル」
(Office 2007以降のWord文書)
解析する DOT ファイル」
(Microsoft Wordテンプレートファイル)
解析する DOTX ファイル」
(Microsoft Wordテンプレートファイル)
解析する ODP ファイル」
(OpenDocument プレゼンテーション形式)
解析する ODS ファイル」
(OpenDocument スプレッドシート)
解析する ODT ファイル」
(OpenDocument テキスト ファイル形式)
解析する PDF ファイル」
(ポータブルドキュメントフォーマット)
解析する PPT ファイル」
(パワーポイントによるプレゼンテーション)
解析する PPTX ファイル」
(オープン XML プレゼンテーション形式)
解析する RTF ファイル」
(リッチテキスト形式)
解析する XLS ファイル」
(Microsoft Excel バイナリ形式)
解析する XLSB ファイル」
(Excel バイナリ ワークブック)
解析する XLSM ファイル」
(マクロが有効なスプレッドシート)
解析する XLSX ファイル」
(XML ワークブックを開く)