processa imagens digitalizadas ou até mesmo fotos de smartphones no formato BMP e cria documentos BMP contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR
Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Com OCR C++ e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem BMP em um documento DOCX:
- Crie uma instância da classe AsposeOcr
- Chama o método AsposeOCR.asposeocr_page()
- Passe o caminho do arquivo BMP como parâmetro
- AsposeOCR.asposeocr_page retorna uma String ou arquivo do tipo DOCX
Requisitos de sistema
Antes de executar o exemplo, certifique-se de que Microsoft.ML.OnnxRuntime 1.7.0 ou superior foi adicionado ao projeto. Ele deve ser instalado automaticamente se você instalar o Aspose.OCR por meio do NuGet Package Manager.
- Solução compatível com NET Standard 2.0+
- Aspose.OCR para .NET referenciado em seu projeto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
BMP O que é BMP Formato de arquivo
Arquivos com extensão .BMP representam arquivos de imagem de bitmap que são usados para armazenar imagens digitais de bitmap. Essas imagens são independentes do adaptador gráfico e também são chamadas de formato de arquivo de bitmap independente de dispositivo (DIB). Essa independência serve para abrir o arquivo em várias plataformas, como Microsoft Windows e Mac. O formato de arquivo BMP pode armazenar dados como imagens digitais bidimensionais em formato monocromático e colorido com várias profundidades de cor.
consulte Mais informaçãoDOCX O que é DOCX Formato de arquivo
DOCX é um formato bem conhecido para documentos do Microsoft Word. Introduzido a partir de 2007 com o lançamento do Microsoft Office 2007, a estrutura desse novo formato de documento foi alterada de binário simples para uma combinação de arquivos XML e binários. Os arquivos Docx podem ser abertos com o Word 2007 e versões laterais, mas não com as versões anteriores do MS Word que suportam extensões de arquivo DOC.
consulte Mais informação