Преобразование JP2 в XML в C#
Выполните оптическое распознавание символов в документе JP2 и сохраните текст как документ JP2, используя Aspose.OCR для библиотеки .NET.
Как преобразовать JP2 в XML с помощью C#
Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений JP2 в документы XML. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.
обрабатывает отсканированные изображения или даже фотографии со смартфона в формате JP2 и создает документы JP2, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Действия по преобразованию JP2 в XML
С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение JP2 в документ XML:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.RecognizeImage
- Передайте путь к файлу JP2 в качестве параметра
- AsposeOCR.RecognizeImage возвращает строку или файл типа XML
Системные Требования
Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
Этот пример кода показывает преобразование JP2 в XML .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JP2");
// print text
File. File.WriteAllText("document.XML", riText);
JP2 Что такое JP2 Формат файла
JPEG 2000 (JP2) — это система кодирования изображений и современный стандарт сжатия изображений. Разработанный с использованием вейвлет-технологии JPEG 2000 может кодировать контент без потерь сразу в любом качестве. Более того, без существенного снижения эффективности кодирования, JPEG 2000 имеет возможность доступа и эффективного декодирования одного и того же контента во множество других разрешений и качеств. Потоки кода в JPEG 2000 значительно масштабируемы, имея интересующие области, которые обеспечивают возможность пространственного произвольного доступа. Обладая до 16384 различных компонентов с размерами в терапикселях и точностью, которая может достигать 38 бит/выборка.
Читать далееXML Что такое XML Формат файла
XML означает Extensible Markup Language, который похож на HTML, но отличается использованием тегов для определения объектов. Вся идея создания формата файла XML заключалась в том, чтобы хранить и передавать данные, не завися от программных или аппаратных инструментов. Его популярность связана с тем, что он читается как человеком, так и машиной. Это позволяет создавать общие протоколы данных в виде объектов, которые будут храниться и совместно использоваться по сети, такой как World Wide Web (WWW). «X» в XML означает расширяемость, что означает, что язык может быть расширен до любого количества символов в соответствии с требованиями пользователя. Именно для этих функций его используют многие стандартные форматы файлов, такие как Microsoft Open XML, LibreOffice OpenDocument, XHTML и SVG.
Читать далееДругие поддерживаемые преобразования
С помощью C# можно легко конвертировать различные форматы, в том числе.