HTML JPG OCR XML BMP
Aspose.OCR  для .NET
DOC

Преобразование PNG в DOC в C#

Выполните оптическое распознавание символов в документе PNG и сохраните текст как документ PNG, используя Aspose.OCR для библиотеки .NET.

Как преобразовать PNG в DOC с помощью C#

Aspose.OCR для .NET — это мощная, но простая в использовании и недорогая библиотека для преобразования изображений PNG в документы DOC. Поддерживая 26 языков на основе латиницы, кириллицы и китайского языка, его современный механизм оптического распознавания символов обеспечивает превосходную скорость и точность распознавания, изолируя вас от формул, нейронных сетей и других сложных технических деталей. Он позволяет добавить функциональность OCR в ваши приложения .NET менее чем за 10 строк кода.

Aspose.OCR для .NET

обрабатывает отсканированные изображения или даже фотографии со смартфона в формате PNG и создает документы PNG, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно установить Aspose.OCR [NuGet] ( https://www.nuget.org/packages/aspose.ocr ) package в своем проекте с помощью следующей команды:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Действия по преобразованию PNG в DOC

С помощью .NET OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение PNG в документ DOC:

  • Создать экземпляр класса AsposeOcr
  • Вызов метода AsposeOCR.RecognizeImage
  • Передайте путь к файлу PNG в качестве параметра
  • AsposeOCR.RecognizeImage возвращает строку или файл типа DOC

Системные Требования

Перед запуском примера убедитесь, что в вашей системе установлен .NET API, совместимый со спецификацией NET Standard 2.0, и все [внешние зависимости] ( https://docs.aspose.com/ocr/net/system-requirements/#external- зависимости) пакета Aspose.OCR упоминаются в вашем проекте.

  • Решение, совместимое с NET Standard 2.0+
  • Aspose.OCR для .NET, указанный в вашем проекте.

Этот пример кода показывает преобразование PNG в DOC .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PNG");
// print text
File. File.WriteAllText("document.DOC", riText);
  • PNG Что такое PNG Формат файла

    PNG, переносимая сетевая графика, относится к типу формата файла растрового изображения, в котором используется сжатие без потерь. Этот формат файла был создан в качестве замены формата обмена графикой (GIF) и не имеет ограничений авторского права. Однако формат файла PNG не поддерживает анимацию. Формат файлов PNG поддерживает сжатие изображений без потерь, что делает его популярным среди пользователей. С течением времени PNG превратился в один из наиболее часто используемых форматов файлов изображений. Почти все операционные системы поддерживают открытие файлов PNG. Например, средство просмотра Microsoft Windows имеет возможность открывать файлы PNG, так как ОС по умолчанию имеет поддержку, доступную как часть установки.

    Читать далее

    DOC Что такое DOC Формат файла

    Файлы с расширением .doc представляют собой документы, сгенерированные Microsoft Word или другими текстовыми редакторами в двоичном формате. Первоначально расширение использовалось для текстовой документации в нескольких различных операционных системах. Он может содержать несколько различных типов данных, таких как изображения, форматированный, а также обычный текст, графики, диаграммы, встроенные объекты, ссылки, страницы, форматирование страниц, настройки печати и многое другое. Этот формат был популярен для всех видов документации из-за множества вариантов, которые он предлагает пользователям для написания руководств, предложений, спецификаций, резюме, статей или любых подобных документов. Обновленной версией DOC является DOCX, основанный на Office OpenXML, спецификации которого находятся в открытом доступе.

    Читать далее

    Другие поддерживаемые преобразования

    С помощью C# можно легко конвертировать различные форматы, в том числе.

    TXT (Файл текстового документа)
    Text (Файл текстового документа)
    DOC (Документы, созданные Microsoft Word)
    DOCX (Документы Microsoft Word)
    XLS (Формат двоичного файла Microsoft Excel)
    XLSX (Документы Microsoft Excel)
    PDF (Переносимый формат документа (PDF))
    Searchable PDF (Портативная сетевая графика с возможностью поиска)
    XML (расширяемый язык разметки)
    JSON (Обозначение объектов JavaScript)