Converter TIFF em DOCX em C#
Execute o reconhecimento óptico de caracteres no documento TIFF e salve o texto como documento TIFF usando a biblioteca Aspose.OCR fro .NET.
Como converter TIFF para DOCX usando C#
Aspose.OCR para .NET é uma biblioteca poderosa, mas fácil de usar e econômica para converter imagens TIFF em documentos DOCX. Suportando 26 idiomas baseados em latim, cirílico e chinês, seu mecanismo de reconhecimento óptico de caracteres de última geração fornece velocidade e precisão de reconhecimento superiores, enquanto isola você de fórmulas, redes neurais e outros detalhes técnicos complexos. Ele permite que você adicione a funcionalidade OCR aos seus aplicativos .NET em menos de 10 linhas de código.
processa imagens digitalizadas ou até mesmo fotos de smartphones no formato TIFF e cria documentos TIFF contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa instalar o Aspose.OCR
package em seu projeto com o seguinte comando:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Etapas para converter TIFF em DOCX
Com o OCR .NET e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem TIFF em um documento DOCX:
- Crie uma instância da classe AsposeOcr
- Chamar o método AsposeOCR.RecognizeImage
- Passe o caminho do arquivo TIFF como parâmetro
- AsposeOCR.RecognizeImage retorna uma String ou arquivo do tipo DOCX
Requisitos de sistema
Antes de executar o exemplo, certifique-se de que a API .NET compatível com a especificação NET Standard 2.0 esteja instalada em seu sistema e todas as [dependências externas]( https://docs.aspose.com/ocr/net/system-requirements/#external- dependencies) do pacote Aspose.OCR são referenciados em seu projeto.
- Solução compatível com NET Standard 2.0+
- Aspose.OCR para .NET referenciado em seu projeto.
Este código de amostra mostra a conversão de TIFF para DOCX .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.TIFF");
// print text
File. File.WriteAllText("document.DOCX", riText);
TIFF O que é TIFF Formato de arquivo
TIFF ou TIF, Tagged Image File Format, representa imagens raster que se destinam ao uso em uma variedade de dispositivos que estão em conformidade com este padrão de formato de arquivo. Ele é capaz de descrever dados de imagem de dois níveis, tons de cinza, cores de paleta e cores em vários espaços de cores. Ele suporta esquemas de compactação com e sem perdas para escolher entre espaço e tempo para aplicativos que usam o formato. O formato é extensível e passou por várias revisões que permitem a inclusão de uma quantidade ilimitada de informações privadas ou de finalidade especial. O formato não depende da máquina e está livre de limites como processador, sistema operacional ou sistemas de arquivos.
consulte Mais informaçãoDOCX O que é DOCX Formato de arquivo
DOCX é um formato bem conhecido para documentos do Microsoft Word. Introduzido a partir de 2007 com o lançamento do Microsoft Office 2007, a estrutura desse novo formato de documento foi alterada de binário simples para uma combinação de arquivos XML e binários. Os arquivos Docx podem ser abertos com o Word 2007 e versões laterais, mas não com as versões anteriores do MS Word que suportam extensões de arquivo DOC.
consulte Mais informaçãoOutras conversões compatíveis
Usando C#, pode-se converter facilmente diferentes formatos, incluindo.