processa imagens digitalizadas ou até mesmo fotos de smartphones no formato DJVU e cria documentos DJVU contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR
Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Com OCR C++ e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem DJVU em um documento DOC:
- Crie uma instância da classe AsposeOcr
- Chama o método AsposeOCR.asposeocr_page()
- Passe o caminho do arquivo DJVU como parâmetro
- AsposeOCR.asposeocr_page retorna uma String ou arquivo do tipo DOC
Requisitos de sistema
Antes de executar o exemplo, certifique-se de que Microsoft.ML.OnnxRuntime 1.7.0 ou superior foi adicionado ao projeto. Ele deve ser instalado automaticamente se você instalar o Aspose.OCR por meio do NuGet Package Manager.
- Solução compatível com NET Standard 2.0+
- Aspose.OCR para .NET referenciado em seu projeto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
DJVU O que é DJVU Formato de arquivo
DjVu, pronunciado como “déjà vu”, é um formato de arquivo gráfico destinado a documentos e livros digitalizados, especialmente aqueles que contêm a combinação de texto, desenhos, imagens e fotografias. Foi desenvolvido pela AT&T Labs. Ele usa várias técnicas, como separação de camadas de imagem de texto e imagens de fundo, carregamento progressivo, codificação aritmética e compactação com perdas para imagens bitonais. Como o arquivo DJVU pode conter imagens coloridas, fotografias, textos e desenhos compactados e de alta qualidade e pode ser salvo em menos espaço, ele é usado na web como eBooks, manuais, jornais, documentos antigos etc.
consulte Mais informaçãoDOC O que é DOC Formato de arquivo
Arquivos com extensão .doc representam documentos gerados pelo Microsoft Word ou outros documentos de processamento de texto em formato de arquivo binário. A extensão foi inicialmente usada para documentação de texto simples em vários sistemas operacionais diferentes. Ele pode conter vários tipos diferentes de dados, como imagens, formatação e texto simples, gráficos, tabelas, objetos incorporados, links, páginas, formatação de página, configurações de impressão e muitos outros. O formato era popular para todo tipo de documentação devido à variedade de opções que oferece aos usuários para escrever manuais, propostas, especificações, currículos, artigos ou documentos semelhantes. A versão atualizada do DOC é o DOCX, que é baseado no Office OpenXML, cujas especificações estão disponíveis abertamente.
consulte Mais informação