Преобразование DJVU в Text в C#
Выполните оптическое распознавание символов в документе DJVU и сохраните текст как документ DJVU, используя Aspose.OCR для библиотеки .NET.
Как преобразовать DJVU в Text с помощью C#
Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений DJVU в документы Text. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.
обрабатывает отсканированные изображения или даже фотографии со смартфона в формате DJVU и создает документы DJVU, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Действия по преобразованию DJVU в Text
С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение DJVU в документ Text:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.RecognizeImage
- Передайте путь к файлу DJVU в качестве параметра
- AsposeOCR.RecognizeImage возвращает строку или файл типа Text
Системные Требования
Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
Этот пример кода показывает преобразование DJVU в Text .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.Text", riText);
DJVU Что такое DJVU Формат файла
DjVu, произносится как «дежа вю», представляет собой формат графических файлов, предназначенный для отсканированных документов и книг, особенно тех, которые содержат комбинацию текста, рисунков, изображений и фотографий. Он был разработан AT&T Labs. Он использует несколько методов, таких как разделение слоя изображения текста и фоновых изображений, прогрессивная загрузка, арифметическое кодирование и сжатие с потерями для битональных изображений. Поскольку файл DJVU может содержать сжатые, но высококачественные цветные изображения, фотографии, текст и рисунки и может занимать меньше места, он используется в Интернете в качестве электронных книг, руководств, газет, древних документов и т. д.
Читать далееText Что такое Text Формат файла
Файл с расширением .TXT представляет собой текстовый документ, содержащий обычный текст в виде строк. Абзацы в текстовом документе распознаются возвратом каретки и используются для лучшего расположения содержимого файла. Стандартный текстовый документ можно открыть в любом текстовом редакторе или текстовом редакторе в разных операционных системах. Весь текст, содержащийся в таком файле, имеет удобочитаемый формат и представлен последовательностью символов.
Читать далееДругие поддерживаемые преобразования
С помощью C# можно легко конвертировать различные форматы, в том числе.