Преобразование JPEG в DOCX в C#
Выполните оптическое распознавание символов в документе JPEG и сохраните текст как документ JPEG, используя Aspose.OCR для библиотеки .NET.
Как преобразовать JPEG в DOCX с помощью C#
Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений JPEG в документы DOCX. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.
обрабатывает отсканированные изображения или даже фотографии со смартфона в формате JPEG и создает документы JPEG, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Действия по преобразованию JPEG в DOCX
С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение JPEG в документ DOCX:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.RecognizeImage
- Передайте путь к файлу JPEG в качестве параметра
- AsposeOCR.RecognizeImage возвращает строку или файл типа DOCX
Системные Требования
Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
Этот пример кода показывает преобразование JPEG в DOCX .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG");
// print text
File. File.WriteAllText("document.DOCX", riText);
JPEG Что такое JPEG Формат файла
JPEG — это тип формата изображения, который сохраняется с использованием метода сжатия с потерями. Выходное изображение в результате сжатия представляет собой компромисс между размером хранилища и качеством изображения. Пользователи могут настроить уровень сжатия для достижения желаемого уровня качества и в то же время уменьшить размер хранилища. Качество изображения незначительно ухудшается, если к изображению применяется сжатие 10:1. Чем выше значение сжатия, тем выше ухудшение качества изображения.
Читать далееDOCX Что такое DOCX Формат файла
DOCX — широко известный формат документов Microsoft Word. Представленный в 2007 году с выпуском Microsoft Office 2007, структура этого нового формата документа была изменена с простого двоичного файла на комбинацию XML и двоичных файлов. Файлы Docx можно открывать в Word 2007 и его более поздних версиях, но не в более ранних версиях MS Word, которые поддерживают расширения файлов DOC.
Читать далееДругие поддерживаемые преобразования
С помощью C# можно легко конвертировать различные форматы, в том числе.