Word ファイルをオンラインおよび .NET 経由で解析
強力な .NET ベースの Word ドキュメント パーサー ユーティリティ アプリケーションを開発します。 Word ドキュメント テキスト抽出用の C# コードのリスト。
オンラインアプリ経由でWordドキュメントを解析
- 解析するWordファイルをアップロードしてインポートします。
- これを行うには、パーサー アプリのドラッグ アンド ドロップでドロップ領域内をクリックします。
- Word ファイルのサイズとインターネット速度に応じて、数秒待ちます。
- 「今すぐ解析」ボタンをクリックしてドキュメントを解析します。
- 解析されたファイルをダウンロードすると、すぐに表示されます。
.NET経由でWordファイルを解析する
- ライブラリ参照を .NET プロジェクトに追加する
- Documentクラスオブジェクトを使用してWordファイルをロードします
- GetChildNodes() を使用してすべての子ノードを取得します
- NodeType.Shapeをパラメータとして使用します
- 各ノードを反復処理して画像を保存します
- テキスト抽出の場合は、各ページをループします
- ExtractPages メソッドを呼び出す
- Node.ToStringメソッドを使用して、抽出したファイルをテキストに保存します
C# コード: Word ドキュメント画像の抽出
Document wDoc = new Document("sourceFileWithImages.docx"); | |
NodeCollection allShapes = wDoc.GetChildNodes(NodeType.Shape, true); | |
int index = 0; | |
foreach (Shape shape in allShapes) { | |
if (shape.HasImage){ | |
string imageFile = "Aspose_" + (index++).ToString() + "_" + shape.Name + ".png"; | |
shape.ImageData.Save(imageFile); | |
} | |
} |
C# コード: Word ドキュメント テキストの抽出
Document doc = new Document(MyDir + "TestFooterDocument.docx"); | |
string txt = ""; | |
int pagecount = doc.PageCount; | |
for (int i = 0; i < pagecount; i++) | |
{ | |
Document newdoc = doc.ExtractPages(i, 1); | |
txt += newdoc.ToString(SaveFormat.Text); | |
} |
.NET 経由で Word ファイル パーサー アプリケーションを開発する
Word パーサー アプリケーションまたはソフトウェアを開発する必要がありますか?
Aspose.Total for .NET
の子 API である
Aspose.Words for .NET
を使用すると、.NET 開発者は上記の API コードをドキュメント パーサー アプリケーション内に統合できます。強力な .NET ライブラリを使用すると、テキストだけでなく画像も抽出するドキュメント解析ソリューションをプログラミングできます。さらに、Word 形式を含む多くの一般的な形式をサポートできます。
パーサー アプリケーション用に Word ファイルを処理する .NET ユーティリティ
Aspose.Words for .NET または Aspose.Total for .NET をシステムにインストールするための代替オプションがあります。ニーズに近いものを選択し、ステップバイステップの指示に従ってください。
- NuGet パッケージ をインストールします。 ドキュメンテーション を参照
- Visual Studio IDE 内で パッケージマネージャーコンソール を使用してライブラリをインストールする
- Windows インストーラー を使用してライブラリを手動でインストールする
システム要求
当社の製品は完全にクロスプラットフォームであり、「.NET Standard 2.0」仕様に準拠したすべての主要な .NET 実装をサポートしています。
- Microsoft .NET Framework (最も古いバージョン 2.0 から始まり、最新の「.NET Framework 4.8」まで)
- .NET Core。最も初期の 2.0 から始まり、最新の「.NET 6」で終わります。
- モノラル >= 2.6.7
.NET コードは基盤となるハードウェアやオペレーティング システムに依存せず、仮想マシンにのみ依存するため、Windows、macOS、Android、iOS、Linux 用のあらゆる種類のソフトウェアを自由に開発できます。対応するバージョンの .NET Framework、.NET Core、Windows Azure、Mono、または Xamarin がインストールされていることを確認してください。
C#、F#、VB.NET アプリケーションを作成するには、Microsoft Visual Studio、Xamarin、および MonoDevelop IDE を使用することをお勧めします。
詳細については 製品ドキュメント を参照してください。
よくある質問
- 上記の .NET コードをアプリケーションで使用できますか?はい、このコードをダウンロードして、.NET ベースのドキュメント パーサー アプリケーションを開発する目的で利用することはできます。このコードは、ノードの読み取りや、テキストや画像を抽出するためのドキュメントのロードなど、バックエンド ドキュメント処理のドメインでプロジェクトの機能と機能を強化するための貴重なリソースとして機能します。
- このオンライン ドキュメント パーサー アプリは Windows 上でのみ動作しますか?Windows、Linux、Mac OS、Android など、実行されているオペレーティング システムに関係なく、任意のデバイスでドキュメントの解析を開始できる柔軟性があります。必要なのは、最新の Web ブラウザとアクティブなインターネット接続だけです。
- Word ドキュメントの解析にオンライン アプリを使用しても安全ですか?もちろん!当社のサービスを通じて生成された出力ファイルは、24 時間以内に当社のサーバーから安全かつ自動的に削除されます。その結果、これらのファイルに関連付けられた表示リンクは、この期間を過ぎると機能しなくなります。
- アプリを使用するにはどのブラウザが必要ですか?オンライン Word ドキュメント パーサーには、Google Chrome、Firefox、Opera、Safari などの最新の Web ブラウザーを使用できます。ただし、デスクトップ アプリケーションを開発している場合は、効率的な管理のために Aspose.Total ドキュメント処理 API を使用することをお勧めします。