Преобразование JPG в XML в C#
Выполните оптическое распознавание символов в документе JPG и сохраните текст как документ JPG, используя Aspose.OCR для библиотеки .NET.
Как преобразовать JPG в XML с помощью C#
Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений JPG в документы XML. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.
обрабатывает отсканированные изображения или даже фотографии со смартфона в формате JPG и создает документы JPG, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Действия по преобразованию JPG в XML
С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение JPG в документ XML:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.RecognizeImage
- Передайте путь к файлу JPG в качестве параметра
- AsposeOCR.RecognizeImage возвращает строку или файл типа XML
Системные Требования
Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
Этот пример кода показывает преобразование JPG в XML .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPG");
// print text
File. File.WriteAllText("document.XML", riText);
JPG Что такое JPG Формат файла
JPEG — это тип формата изображения, который сохраняется с использованием метода сжатия с потерями. Выходное изображение в результате сжатия представляет собой компромисс между размером хранилища и качеством изображения. Пользователи могут настроить уровень сжатия для достижения желаемого уровня качества и в то же время уменьшить размер хранилища. Качество изображения незначительно ухудшается, если к изображению применяется сжатие 10:1. Чем выше значение сжатия, тем выше ухудшение качества изображения.
Читать далееXML Что такое XML Формат файла
XML означает Extensible Markup Language, который похож на HTML, но отличается использованием тегов для определения объектов. Вся идея создания формата файла XML заключалась в том, чтобы хранить и передавать данные, не завися от программных или аппаратных инструментов. Его популярность связана с тем, что он читается как человеком, так и машиной. Это позволяет создавать общие протоколы данных в виде объектов, которые будут храниться и совместно использоваться по сети, такой как World Wide Web (WWW). «X» в XML означает расширяемость, что означает, что язык может быть расширен до любого количества символов в соответствии с требованиями пользователя. Именно для этих функций его используют многие стандартные форматы файлов, такие как Microsoft Open XML, LibreOffice OpenDocument, XHTML и SVG.
Читать далееДругие поддерживаемые преобразования
С помощью C# можно легко конвертировать различные форматы, в том числе.