Converter DJVU em Searchable PDF em C#
Execute o reconhecimento óptico de caracteres no documento DJVU e salve o texto como documento DJVU usando a biblioteca Aspose.OCR fro .NET.
Como converter DJVU para Searchable PDF usando C#
Aspose.OCR para .NET é uma biblioteca poderosa, mas fácil de usar e econômica para converter imagens DJVU em documentos Searchable PDF. Suportando 26 idiomas baseados em latim, cirílico e chinês, seu mecanismo de reconhecimento óptico de caracteres de última geração fornece velocidade e precisão de reconhecimento superiores, enquanto isola você de fórmulas, redes neurais e outros detalhes técnicos complexos. Ele permite que você adicione a funcionalidade OCR aos seus aplicativos .NET em menos de 10 linhas de código.
processa imagens digitalizadas ou até mesmo fotos de smartphones no formato DJVU e cria documentos DJVU contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa instalar o Aspose.OCR
package em seu projeto com o seguinte comando:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Etapas para converter DJVU em Searchable PDF
Com o OCR .NET e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem DJVU em um documento Searchable PDF:
- Crie uma instância da classe AsposeOcr
- Chamar o método AsposeOCR.RecognizeImage
- Passe o caminho do arquivo DJVU como parâmetro
- AsposeOCR.RecognizeImage retorna uma String ou arquivo do tipo Searchable PDF
Requisitos de sistema
Antes de executar o exemplo, certifique-se de que a API .NET compatível com a especificação NET Standard 2.0 esteja instalada em seu sistema e todas as [dependências externas]( https://docs.aspose.com/ocr/net/system-requirements/#external- dependencies) do pacote Aspose.OCR são referenciados em seu projeto.
- Solução compatível com NET Standard 2.0+
- Aspose.OCR para .NET referenciado em seu projeto.
Este código de amostra mostra a conversão de DJVU para Searchable PDF .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
DJVU O que é DJVU Formato de arquivo
DjVu, pronunciado como “déjà vu”, é um formato de arquivo gráfico destinado a documentos e livros digitalizados, especialmente aqueles que contêm a combinação de texto, desenhos, imagens e fotografias. Foi desenvolvido pela AT&T Labs. Ele usa várias técnicas, como separação de camadas de imagem de texto e imagens de fundo, carregamento progressivo, codificação aritmética e compactação com perdas para imagens bitonais. Como o arquivo DJVU pode conter imagens coloridas, fotografias, textos e desenhos compactados e de alta qualidade e pode ser salvo em menos espaço, ele é usado na web como eBooks, manuais, jornais, documentos antigos etc.
consulte Mais informaçãoSearchable PDF O que é Searchable PDF Formato de arquivo
Os arquivos PDF pesquisáveis retêm a imagem digitalizada original para visualização, bem como o texto OCR em uma camada oculta que pode ser usada para pesquisas de texto completo em um documento ou realce de texto para operações de copiar e colar. A conversão OCR completa para PDF, sem incluir a imagem original, nunca reterá 100% da formatação original, especialmente se o documento tiver muitas imagens ou um layout complexo.
consulte Mais informaçãoOutras conversões compatíveis
Usando C#, pode-se converter facilmente diferentes formatos, incluindo.