C#でTIFFをXMLに変換します
TIFFドキュメントで光学式文字認識を実行し、.NETライブラリのAspose.OCRを使用してテキストをTIFFドキュメントとして保存します。
C#を使用してTIFFをXMLに変換する方法
Aspose.OCR for .NETは、TIFF画像をXMLドキュメントに変換するための、強力でありながら使いやすく、費用対効果の高いライブラリです。ラテン語、キリル文字、中国語に基づく26の言語をサポートする、最先端の光学式文字認識エンジンは、数式、ニューラルネットワーク、その他の複雑な技術的詳細からユーザーを隔離しながら、優れた認識速度と精度を提供します。これにより、10行未満のコードで.NETアプリケーションにOCR機能を追加できます。
[Aspose.OCR for .NET](https://products.aspose.com/ocr/net) スキャンした画像やスマートフォンの写真をTIFF形式で処理し、認識されたテキストを含むTIFFドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRをインストールするだけです。 [NuGet](https://www.nuget.org/packages/aspose.ocr) 次のコマンドを使用してプロジェクトにパッケージ化します。
Package Manager Console Command
PM> Install-Package Aspose.OCR
TIFFをXMLに変換する手順
.NET OCRと数行のコードを使用して、TIFF画像をXMLドキュメントに変換するフル機能のアプリケーションを作成できます。
+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizeImageメソッドを呼び出します +TIFFファイルパスをパラメータとして渡します
- AsposeOCR.RecognizeImageは、XMLタイプの文字列またはファイルを返します
システム要求
例を実行する前に、NET Standard2.0仕様と互換性のある.NETAPIがシステムとすべての[外部依存関係](https://docs.aspose.com/ocr/net/system-requirements/#external-)にインストールされていることを確認してください。 Aspose.OCRパッケージの依存関係)がプロジェクトで参照されます。
-NETStandard2.0+互換ソリューション -プロジェクトで参照されているAspose.OCRfor.NET。
このサンプルコードは、TIFFからXML.NETへの変換を示しています
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.TIFF");
// print text
File. File.WriteAllText("document.XML", riText);
TIFF とは TIFF ファイル形式
TIFFまたはTIF(タグ付き画像ファイル形式)は、このファイル形式標準に準拠するさまざまなデバイスでの使用を目的としたラスター画像を表します。いくつかの色空間で、バイレベル、グレースケール、パレットカラー、およびフルカラーの画像データを記述することができます。この形式を使用するアプリケーションのスペースと時間のどちらかを選択するための非可逆圧縮方式と可逆圧縮方式をサポートしています。このフォーマットは拡張可能であり、無制限の量の個人情報または特別目的情報を含めることができるようにいくつかの改訂が行われています。この形式はマシンに依存せず、プロセッサ、オペレーティングシステム、ファイルシステムなどの境界がありません。
続きを読むXML とは XML ファイル形式
XMLはExtensibleMarkupLanguageの略で、HTMLに似ていますが、オブジェクトを定義するためのタグの使用が異なります。 XMLファイル形式の作成の背後にある全体的な考え方は、ソフトウェアやハードウェアのツールに依存することなくデータを保存および転送することでした。その人気は、人間と機械の両方で読み取り可能であるためです。これにより、World Wide Web(WWW)などのネットワークを介して保存および共有されるオブジェクトの形式で共通のデータプロトコルを作成できます。 XMLの「X」は拡張可能であり、ユーザーの要件に応じて言語を任意の数の記号に拡張できることを意味します。 Microsoft Open XML、LibreOffice OpenDocument、XHTML、SVGなど、多くの標準ファイル形式で使用されるのはこれらの機能のためです。
続きを読むその他のサポートされている変換
C#を使用すると、を含むさまざまな形式を簡単に変換できます。