C#でDJVUをDOCXに変換します
DJVUドキュメントで光学式文字認識を実行し、.NETライブラリのAspose.OCRを使用してテキストをDJVUドキュメントとして保存します。
C#を使用してDJVUをDOCXに変換する方法
Aspose.OCR for .NETは、DJVU画像をDOCXドキュメントに変換するための、強力でありながら使いやすく、費用対効果の高いライブラリです。ラテン語、キリル文字、中国語に基づく26の言語をサポートする、最先端の光学式文字認識エンジンは、数式、ニューラルネットワーク、その他の複雑な技術的詳細からユーザーを隔離しながら、優れた認識速度と精度を提供します。これにより、10行未満のコードで.NETアプリケーションにOCR機能を追加できます。
[Aspose.OCR for .NET](https://products.aspose.com/ocr/net) スキャンした画像やスマートフォンの写真をDJVU形式で処理し、認識されたテキストを含むDJVUドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRをインストールするだけです。 [NuGet](https://www.nuget.org/packages/aspose.ocr) 次のコマンドを使用してプロジェクトにパッケージ化します。
Package Manager Console Command
PM> Install-Package Aspose.OCR
DJVUをDOCXに変換する手順
.NET OCRと数行のコードを使用して、DJVU画像をDOCXドキュメントに変換するフル機能のアプリケーションを作成できます。
+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizeImageメソッドを呼び出します +DJVUファイルパスをパラメータとして渡します
- AsposeOCR.RecognizeImageは、DOCXタイプの文字列またはファイルを返します
システム要求
例を実行する前に、NET Standard2.0仕様と互換性のある.NETAPIがシステムとすべての[外部依存関係](https://docs.aspose.com/ocr/net/system-requirements/#external-)にインストールされていることを確認してください。 Aspose.OCRパッケージの依存関係)がプロジェクトで参照されます。
-NETStandard2.0+互換ソリューション -プロジェクトで参照されているAspose.OCRfor.NET。
このサンプルコードは、DJVUからDOCX.NETへの変換を示しています
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOCX", riText);
DJVU とは DJVU ファイル形式
「déjàvu」と発音されるDjVuは、スキャンされたドキュメントや書籍、特にテキスト、図面、画像、写真の組み合わせを含むものを対象としたグラフィックファイル形式です。 AT&T研究所によって開発されました。テキストと背景画像の画像レイヤー分離、プログレッシブローディング、算術符号化、ビットノン画像の不可逆圧縮などの複数の手法を使用します。 DJVUファイルには、圧縮された高品質のカラー画像、写真、テキスト、および図面を含めることができ、より少ないスペースで保存できるため、電子書籍、マニュアル、新聞、古代文書などとしてWebで使用されます。
続きを読むDOCX とは DOCX ファイル形式
DOCXは、MicrosoftWord文書のよく知られた形式です。 2007年からMicrosoftOffice2007のリリースで導入されたこの新しいドキュメント形式の構造は、プレーンバイナリからXMLファイルとバイナリファイルの組み合わせに変更されました。 Docxファイルは、Word 2007およびラテラルバージョンで開くことができますが、DOCファイル拡張子をサポートする以前のバージョンのMSWordでは開くことができません。
続きを読むその他のサポートされている変換
C#を使用すると、を含むさまざまな形式を簡単に変換できます。