HTML JPG OCR XML BMP
Aspose.OCR  для .NET
DOC

Преобразование GIF в DOC в C#

Выполните оптическое распознавание символов в документе GIF и сохраните текст как документ GIF, используя Aspose.OCR для библиотеки .NET.

Как преобразовать GIF в DOC с помощью C#

Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений GIF в документы DOC. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.

Aspose.OCR для .NET

обрабатывает отсканированные изображения или даже фотографии со смартфона в формате GIF и создает документы GIF, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Действия по преобразованию GIF в DOC

С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение GIF в документ DOC:

  • Создать экземпляр класса AsposeOcr
  • Вызов метода AsposeOCR.RecognizeImage
  • Передайте путь к файлу GIF в качестве параметра
  • AsposeOCR.RecognizeImage возвращает строку или файл типа DOC

Системные Требования

Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.

  • Решение, совместимое с NET Standard 2.0+
  • Aspose.OCR для .NET, указанный в вашем проекте.

Этот пример кода показывает преобразование GIF в DOC .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.GIF");
// print text
File. File.WriteAllText("document.DOC", riText);
  • GIF Что такое GIF Формат файла

    Формат GIF или Graphical Interchange Format представляет собой тип сильно сжатого изображения. Принадлежащий Unisys, GIF использует алгоритм сжатия LZW, который не ухудшает качество изображения. Для каждого изображения в формате GIF обычно допускается до 8 бит на пиксель, а в изображении допускается до 256 цветов. В отличие от изображения в формате JPEG, которое может отображать до 16 миллионов цветов и довольно далеко выходит за пределы возможностей человеческого глаза. Когда появился Интернет, GIF-файлы оставались лучшим выбором, потому что они требовали низкой пропускной способности и были совместимы с графикой, которая использует сплошные области цвета. Анимированный GIF объединяет множество изображений или кадров в один файл и отображает их в последовательности для создания анимированного клипа или короткого видео. Ограничения по цвету составляют до 256 для каждого кадра и, вероятно, будут наименее подходящими для воспроизведения других изображений и фотографий с цветовым градиентом.

    Читать далее

    DOC Что такое DOC Формат файла

    Файлы с расширением .doc представляют собой документы, сгенерированные Microsoft Word или другими текстовыми редакторами в двоичном формате. Первоначально расширение использовалось для текстовой документации в нескольких различных операционных системах. Он может содержать несколько различных типов данных, таких как изображения, форматированный, а также обычный текст, графики, диаграммы, встроенные объекты, ссылки, страницы, форматирование страниц, настройки печати и многое другое. Этот формат был популярен для всех видов документации из-за множества вариантов, которые он предлагает пользователям для написания руководств, предложений, спецификаций, резюме, статей или любых подобных документов. Обновленной версией DOC является DOCX, основанный на Office OpenXML, спецификации которого находятся в открытом доступе.

    Читать далее

    Другие поддерживаемые преобразования

    С помощью C# можно легко конвертировать различные форматы, в том числе.

    TXT (Файл текстового документа)
    Text (Файл текстового документа)
    DOC (Документы, созданные Microsoft Word)
    DOCX (Документы Microsoft Word)
    XLS (Формат двоичного файла Microsoft Excel)
    XLSX (Документы Microsoft Excel)
    PDF (Переносимый формат документа (PDF))
    Searchable PDF (Портативная сетевая графика с возможностью поиска)
    XML (расширяемый язык разметки)
    JSON (Обозначение объектов JavaScript)