Word ファイルをオンラインおよび C++ 経由で解析する
強力な C++ ベースの Word ドキュメント パーサー ユーティリティ アプリケーションを開発します。Word ドキュメントのテキスト抽出用にリストされた C++ コード。
オンラインアプリでWordドキュメントを解析する
- Word ファイルをアップロードしてインポートし、解析します。
- パーサー アプリのドラッグ アンド ドロップを介してドロップ領域内をクリックして実行します。
- Word ファイルのサイズとインターネットの速度に応じて、数秒お待ちください。
- ドキュメントを解析するには、「今すぐ解析」ボタンをクリックします。
- 解析されたファイルをダウンロードしてすぐに表示します。
C++ 経由で Word ファイルを解析する
- C++ プロジェクトにライブラリ参照を追加する
- Wordファイルを読み込む
- GetChildNodesを使用してすべての子ノードを取得します。
- NodeType::Shapeをパラメータとして使用します
- 各ノードを反復処理して画像を保存する
- shape->get_ImageData()->Save メソッドを使用して抽出したファイルを保存します。
C++ コード: Word ドキュメント画像の抽出
System::String inputDataDir = GetInputDataDir_WorkingWithImages(); | |
System::String outputDataDir = GetOutputDataDir_WorkingWithImages(); | |
System::SharedPtr<Document> doc = System::MakeObject<Document>(inputDataDir + u"Image.SampleImages.doc"); | |
System::SharedPtr<NodeCollection> shapes = doc->GetChildNodes(NodeType::Shape, true); | |
int32_t imageIndex = 0; | |
for (System::SharedPtr<Shape> shape : System::IterateOver<System::SharedPtr<Shape>>(shapes)) | |
{ | |
if (shape->get_HasImage()) | |
{ | |
System::String imageFileName = System::String::Format(u"Image.ExportImages.{0}.{1}", imageIndex, FileFormatUtil::ImageTypeToExtension(shape->get_ImageData()->get_ImageType())); | |
System::String imagePath = outputDataDir + imageFileName; | |
shape->get_ImageData()->Save(imagePath); | |
std::cout << "Image saved at " << imagePath.ToUtf8String() << std::endl; | |
imageIndex++; | |
} | |
} |
C++ で Word ファイル パーサー アプリケーションを開発する
Word パーサー アプリケーションまたはソフトウェアを開発する必要がありますか?
Aspose.Words for C++
は
Aspose.Total for C++
の子 API であるため、どの C++ 開発者でも上記の API コードをドキュメント パーサー アプリケーション内に統合できます。強力な C++ ライブラリを使用すると、テキストだけでなく画像も抽出するドキュメント解析ソリューションをプログラミングできます。さらに、Word 形式を含む多くの一般的な形式をサポートできます。
パーサー アプリケーション用の Word ファイルを処理する C++ ユーティリティ
開発環境に Aspose.Words for C++ または Aspose.Total for C++ をインストールするには、3 つのオプションがあります。ニーズに似たものを選択し、ステップバイステップの指示に従ってください。
- NuGet パッケージ をインストールします。 ドキュメンテーション を参照してください
- Visual Studio IDE内で パッケージ マネージャー コンソール を使用してライブラリをインストールする
- Windowsインストーラー を使用して手動でライブラリをインストールする
システム要求
この C++ ライブラリを使用して、Microsoft Windows、Linux、macOS オペレーティング システム上でソフトウェアを開発できます。
- LinuxではGCC >= 6.3.0およびClang >= 3.9.1が必要です
- macOS には Xcode >= 12.5.1、Clang、libc++ が必要です
Linux または macOS 用のソフトウェアを開発する場合は、
製品ドキュメント
で追加のライブラリ依存関係 (fontconfig および mesa-glu オープンソース パッケージ) に関する情報を確認してください。
よくある質問
- 上記の C++ コードをアプリケーションで使用できますか?はい、このコードをダウンロードして、C++ ベースのドキュメント パーサー アプリケーションの開発に活用していただけます。このコードは、ノードの読み取りや、テキストと画像の抽出のためのドキュメントの読み込みなど、バックエンド ドキュメント処理の領域でプロジェクトの機能と能力を強化するための貴重なリソースとして機能します。
- このオンライン ドキュメント パーサー アプリは Windows でのみ動作しますか?Windows、Linux、Mac OS、Android など、どのオペレーティング システムで実行されているかに関係なく、どのデバイスでもドキュメントの解析を開始できる柔軟性があります。必要なのは、最新の Web ブラウザとアクティブなインターネット接続だけです。
- Word ドキュメントを解析するためにオンライン アプリを使用するのは安全ですか?もちろんです! 当社のサービスを通じて生成された出力ファイルは、24 時間以内に当社サーバーから安全かつ自動的に削除されます。その結果、これらのファイルに関連付けられた表示リンクは、この期間を過ぎると機能しなくなります。
- アプリを使用するにはどのブラウザが必要ですか?オンライン Word ドキュメント パーサーには、Google Chrome、Firefox、Opera、Safari などの最新の Web ブラウザーを使用できます。ただし、デスクトップ アプリケーションを開発している場合は、効率的な管理のために Aspose.Total ドキュメント処理 API を使用することをお勧めします。