HTML JPG OCR XML BMP
Aspose.OCR  для .NET
TXT

Преобразование DJVU в TXT в C#

Выполните оптическое распознавание символов в документе DJVU и сохраните текст как документ DJVU, используя Aspose.OCR для библиотеки .NET.

Как преобразовать DJVU в TXT с помощью C#

Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений DJVU в документы TXT. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.

Aspose.OCR для .NET

обрабатывает отсканированные изображения или даже фотографии со смартфона в формате DJVU и создает документы DJVU, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Действия по преобразованию DJVU в TXT

С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение DJVU в документ TXT:

  • Создать экземпляр класса AsposeOcr
  • Вызов метода AsposeOCR.RecognizeImage
  • Передайте путь к файлу DJVU в качестве параметра
  • AsposeOCR.RecognizeImage возвращает строку или файл типа TXT

Системные Требования

Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.

  • Решение, совместимое с NET Standard 2.0+
  • Aspose.OCR для .NET, указанный в вашем проекте.

Этот пример кода показывает преобразование DJVU в TXT .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.TXT", riText);
  • DJVU Что такое DJVU Формат файла

    DjVu, произносится как «дежа вю», представляет собой формат графических файлов, предназначенный для отсканированных документов и книг, особенно тех, которые содержат комбинацию текста, рисунков, изображений и фотографий. Он был разработан AT&T Labs. Он использует несколько методов, таких как разделение слоя изображения текста и фоновых изображений, прогрессивная загрузка, арифметическое кодирование и сжатие с потерями для битональных изображений. Поскольку файл DJVU может содержать сжатые, но высококачественные цветные изображения, фотографии, текст и рисунки и может занимать меньше места, он используется в Интернете в качестве электронных книг, руководств, газет, древних документов и т. д.

    Читать далее

    TXT Что такое TXT Формат файла

    Файл с расширением .TXT представляет собой текстовый документ, содержащий обычный текст в виде строк. Абзацы в текстовом документе распознаются возвратом каретки и используются для лучшего расположения содержимого файла. Стандартный текстовый документ можно открыть в любом текстовом редакторе или текстовом редакторе в разных операционных системах. Весь текст, содержащийся в таком файле, имеет удобочитаемый формат и представлен последовательностью символов.

    Читать далее

    Другие поддерживаемые преобразования

    С помощью C# можно легко конвертировать различные форматы, в том числе.

    TXT (Файл текстового документа)
    Text (Файл текстового документа)
    DOC (Документы, созданные Microsoft Word)
    DOCX (Документы Microsoft Word)
    XLS (Формат двоичного файла Microsoft Excel)
    XLSX (Документы Microsoft Excel)
    PDF (Переносимый формат документа (PDF))
    Searchable PDF (Портативная сетевая графика с возможностью поиска)
    XML (расширяемый язык разметки)
    JSON (Обозначение объектов JavaScript)