HTML JPG OCR XML BMP
Aspose.OCR  para .NET
DOCX

Converter JPEG em DOCX em C#

Execute o reconhecimento óptico de caracteres no documento JPEG e salve o texto como documento JPEG usando a biblioteca Aspose.OCR fro .NET.

Como converter JPEG para DOCX usando C#

Aspose.OCR para .NET é uma biblioteca poderosa, mas fácil de usar e econômica para converter imagens JPEG em documentos DOCX. Suportando 26 idiomas baseados em latim, cirílico e chinês, seu mecanismo de reconhecimento óptico de caracteres de última geração fornece velocidade e precisão de reconhecimento superiores, enquanto isola você de fórmulas, redes neurais e outros detalhes técnicos complexos. Ele permite que você adicione a funcionalidade OCR aos seus aplicativos .NET em menos de 10 linhas de código.

Aspose.OCR para .NET

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato JPEG e cria documentos JPEG contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa instalar o Aspose.OCR

NuGet

package em seu projeto com o seguinte comando:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Etapas para converter JPEG em DOCX

Com o OCR .NET e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem JPEG em um documento DOCX:

  • Crie uma instância da classe AsposeOcr
  • Chamar o método AsposeOCR.RecognizeImage
  • Passe o caminho do arquivo JPEG como parâmetro
  • AsposeOCR.RecognizeImage retorna uma String ou arquivo do tipo DOCX

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que a API .NET compatível com a especificação NET Standard 2.0 esteja instalada em seu sistema e todas as [dependências externas]( https://docs.aspose.com/ocr/net/system-requirements/#external- dependencies) do pacote Aspose.OCR são referenciados em seu projeto.

  • Solução compatível com NET Standard 2.0+
  • Aspose.OCR para .NET referenciado em seu projeto.

Este código de amostra mostra a conversão de JPEG para DOCX .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG");
// print text
File. File.WriteAllText("document.DOCX", riText);
  • JPEG O que é JPEG Formato de arquivo

    Um JPEG é um tipo de formato de imagem que é salvo usando o método de compactação com perdas. A imagem de saída, como resultado da compactação, é uma compensação entre o tamanho do armazenamento e a qualidade da imagem. Os usuários podem ajustar o nível de compactação para atingir o nível de qualidade desejado e, ao mesmo tempo, reduzir o tamanho do armazenamento. A qualidade da imagem é afetada de forma insignificante se a compressão 10:1 for aplicada à imagem. Quanto maior o valor de compactação, maior a degradação na qualidade da imagem.

    consulte Mais informação

    DOCX O que é DOCX Formato de arquivo

    DOCX é um formato bem conhecido para documentos do Microsoft Word. Introduzido a partir de 2007 com o lançamento do Microsoft Office 2007, a estrutura desse novo formato de documento foi alterada de binário simples para uma combinação de arquivos XML e binários. Os arquivos Docx podem ser abertos com o Word 2007 e versões laterais, mas não com as versões anteriores do MS Word que suportam extensões de arquivo DOC.

    consulte Mais informação

    Outras conversões compatíveis

    Usando C#, pode-se converter facilmente diferentes formatos, incluindo.

    TXT (Arquivo de documento de texto)
    Text (Arquivo de documento de texto)
    DOC (Documentos gerados pelo Microsoft Word)
    DOCX (Documentos do Microsoft Word)
    XLS (Formato de arquivo binário do Microsoft Excel)
    XLSX (Documentos do Microsoft Excel)
    PDF (Formato de Documento Portátil (PDF))
    Searchable PDF (Gráficos de rede portáteis pesquisáveis)
    XML (Extensible Markup Language)
    JSON (Notação de Objeto JavaScript)