Converter JPEG em DOC em C#
Execute o reconhecimento óptico de caracteres no documento JPEG e salve o texto como documento JPEG usando a biblioteca Aspose.OCR fro .NET.
Como converter JPEG para DOC usando C#
Aspose.OCR para .NET é uma biblioteca poderosa, mas fácil de usar e econômica para converter imagens JPEG em documentos DOC. Suportando 26 idiomas baseados em latim, cirílico e chinês, seu mecanismo de reconhecimento óptico de caracteres de última geração fornece velocidade e precisão de reconhecimento superiores, enquanto isola você de fórmulas, redes neurais e outros detalhes técnicos complexos. Ele permite que você adicione a funcionalidade OCR aos seus aplicativos .NET em menos de 10 linhas de código.
processa imagens digitalizadas ou até mesmo fotos de smartphones no formato JPEG e cria documentos JPEG contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa instalar o Aspose.OCR
package em seu projeto com o seguinte comando:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Etapas para converter JPEG em DOC
Com o OCR .NET e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem JPEG em um documento DOC:
- Crie uma instância da classe AsposeOcr
- Chamar o método AsposeOCR.RecognizeImage
- Passe o caminho do arquivo JPEG como parâmetro
- AsposeOCR.RecognizeImage retorna uma String ou arquivo do tipo DOC
Requisitos de sistema
Antes de executar o exemplo, certifique-se de que a API .NET compatível com a especificação NET Standard 2.0 esteja instalada em seu sistema e todas as [dependências externas]( https://docs.aspose.com/ocr/net/system-requirements/#external- dependencies) do pacote Aspose.OCR são referenciados em seu projeto.
- Solução compatível com NET Standard 2.0+
- Aspose.OCR para .NET referenciado em seu projeto.
Este código de amostra mostra a conversão de JPEG para DOC .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG");
// print text
File. File.WriteAllText("document.DOC", riText);
JPEG O que é JPEG Formato de arquivo
Um JPEG é um tipo de formato de imagem que é salvo usando o método de compactação com perdas. A imagem de saída, como resultado da compactação, é uma compensação entre o tamanho do armazenamento e a qualidade da imagem. Os usuários podem ajustar o nível de compactação para atingir o nível de qualidade desejado e, ao mesmo tempo, reduzir o tamanho do armazenamento. A qualidade da imagem é afetada de forma insignificante se a compressão 10:1 for aplicada à imagem. Quanto maior o valor de compactação, maior a degradação na qualidade da imagem.
consulte Mais informaçãoDOC O que é DOC Formato de arquivo
Arquivos com extensão .doc representam documentos gerados pelo Microsoft Word ou outros documentos de processamento de texto em formato de arquivo binário. A extensão foi inicialmente usada para documentação de texto simples em vários sistemas operacionais diferentes. Ele pode conter vários tipos diferentes de dados, como imagens, formatação e texto simples, gráficos, tabelas, objetos incorporados, links, páginas, formatação de página, configurações de impressão e muitos outros. O formato era popular para todo tipo de documentação devido à variedade de opções que oferece aos usuários para escrever manuais, propostas, especificações, currículos, artigos ou documentos semelhantes. A versão atualizada do DOC é o DOCX, que é baseado no Office OpenXML, cujas especificações estão disponíveis abertamente.
consulte Mais informaçãoOutras conversões compatíveis
Usando C#, pode-se converter facilmente diferentes formatos, incluindo.