HTML JPG OCR XML BMP
Aspose.OCR  para .NET
DOC

Converter JP2 em DOC em C#

Execute o reconhecimento óptico de caracteres no documento JP2 e salve o texto como documento JP2 usando a biblioteca Aspose.OCR fro .NET.

Como converter JP2 para DOC usando C#

Aspose.OCR para .NET é uma biblioteca poderosa, mas fácil de usar e econômica para converter imagens JP2 em documentos DOC. Suportando 26 idiomas baseados em latim, cirílico e chinês, seu mecanismo de reconhecimento óptico de caracteres de última geração fornece velocidade e precisão de reconhecimento superiores, enquanto isola você de fórmulas, redes neurais e outros detalhes técnicos complexos. Ele permite que você adicione a funcionalidade OCR aos seus aplicativos .NET em menos de 10 linhas de código.

Aspose.OCR para .NET

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato JP2 e cria documentos JP2 contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa instalar o Aspose.OCR

NuGet

package em seu projeto com o seguinte comando:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Etapas para converter JP2 em DOC

Com o OCR .NET e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem JP2 em um documento DOC:

  • Crie uma instância da classe AsposeOcr
  • Chamar o método AsposeOCR.RecognizeImage
  • Passe o caminho do arquivo JP2 como parâmetro
  • AsposeOCR.RecognizeImage retorna uma String ou arquivo do tipo DOC

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que a API .NET compatível com a especificação NET Standard 2.0 esteja instalada em seu sistema e todas as [dependências externas]( https://docs.aspose.com/ocr/net/system-requirements/#external- dependencies) do pacote Aspose.OCR são referenciados em seu projeto.

  • Solução compatível com NET Standard 2.0+
  • Aspose.OCR para .NET referenciado em seu projeto.

Este código de amostra mostra a conversão de JP2 para DOC .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JP2");
// print text
File. File.WriteAllText("document.DOC", riText);
  • JP2 O que é JP2 Formato de arquivo

    JPEG 2000 (JP2) é um sistema de codificação de imagem e padrão de compressão de imagem de última geração. Projetado, usando a tecnologia wavelet JPEG 2000 pode codificar conteúdo sem perdas em qualquer qualidade de uma só vez. Além disso, sem nenhuma penalidade substancial na eficiência de codificação, o JPEG 2000 tem a capacidade de acessar e decodificar o mesmo conteúdo de forma eficaz em uma variedade de outras resoluções e qualidades. Os fluxos de código em JPEG 2000 são significativamente escaláveis ​​com regiões de interesse que fornecem a facilidade de acesso espacial aleatório. Possuindo até 16384 componentes diversos com as dimensões em terapixels, e precisão que pode chegar a 38 bits/amostra.

    consulte Mais informação

    DOC O que é DOC Formato de arquivo

    Arquivos com extensão .doc representam documentos gerados pelo Microsoft Word ou outros documentos de processamento de texto em formato de arquivo binário. A extensão foi inicialmente usada para documentação de texto simples em vários sistemas operacionais diferentes. Ele pode conter vários tipos diferentes de dados, como imagens, formatação e texto simples, gráficos, tabelas, objetos incorporados, links, páginas, formatação de página, configurações de impressão e muitos outros. O formato era popular para todo tipo de documentação devido à variedade de opções que oferece aos usuários para escrever manuais, propostas, especificações, currículos, artigos ou documentos semelhantes. A versão atualizada do DOC é o DOCX, que é baseado no Office OpenXML, cujas especificações estão disponíveis abertamente.

    consulte Mais informação

    Outras conversões compatíveis

    Usando C#, pode-se converter facilmente diferentes formatos, incluindo.

    TXT (Arquivo de documento de texto)
    Text (Arquivo de documento de texto)
    DOC (Documentos gerados pelo Microsoft Word)
    DOCX (Documentos do Microsoft Word)
    XLS (Formato de arquivo binário do Microsoft Excel)
    XLSX (Documentos do Microsoft Excel)
    PDF (Formato de Documento Portátil (PDF))
    Searchable PDF (Gráficos de rede portáteis pesquisáveis)
    XML (Extensible Markup Language)
    JSON (Notação de Objeto JavaScript)