Преобразование DJVU в DOCX в C#
Выполните оптическое распознавание символов в документе DJVU и сохраните текст как документ DJVU, используя Aspose.OCR для библиотеки .NET.
Как преобразовать DJVU в DOCX с помощью C#
Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений DJVU в документы DOCX. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.
обрабатывает отсканированные изображения или даже фотографии со смартфона в формате DJVU и создает документы DJVU, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Действия по преобразованию DJVU в DOCX
С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение DJVU в документ DOCX:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.RecognizeImage
- Передайте путь к файлу DJVU в качестве параметра
- AsposeOCR.RecognizeImage возвращает строку или файл типа DOCX
Системные Требования
Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
Этот пример кода показывает преобразование DJVU в DOCX .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOCX", riText);
DJVU Что такое DJVU Формат файла
DjVu, произносится как «дежа вю», представляет собой формат графических файлов, предназначенный для отсканированных документов и книг, особенно тех, которые содержат комбинацию текста, рисунков, изображений и фотографий. Он был разработан AT&T Labs. Он использует несколько методов, таких как разделение слоя изображения текста и фоновых изображений, прогрессивная загрузка, арифметическое кодирование и сжатие с потерями для битональных изображений. Поскольку файл DJVU может содержать сжатые, но высококачественные цветные изображения, фотографии, текст и рисунки и может занимать меньше места, он используется в Интернете в качестве электронных книг, руководств, газет, древних документов и т. д.
Читать далееDOCX Что такое DOCX Формат файла
DOCX — широко известный формат документов Microsoft Word. Представленный в 2007 году с выпуском Microsoft Office 2007, структура этого нового формата документа была изменена с простого двоичного файла на комбинацию XML и двоичных файлов. Файлы Docx можно открывать в Word 2007 и его более поздних версиях, но не в более ранних версиях MS Word, которые поддерживают расширения файлов DOC.
Читать далееДругие поддерживаемые преобразования
С помощью C# можно легко конвертировать различные форматы, в том числе.