Aspose.OCR  for C++

Converta imagens e PDFs em texto em C++

Adicione o reconhecimento óptico de caracteres (OCR) aos seus aplicativos C++ com algumas linhas de código.

  Download Free Trial
  
 

Aspose.OCR para C++ estende seus aplicativos com recursos de reconhecimento óptico de caracteres em 5 linhas de código. Nossa experiência em redes neurais e aprendizado de máquina foi traduzida em uma biblioteca OCR com desempenho e precisão superiores que suporta 26 idiomas baseados em scripts latinos e cirílicos , além de chinês . A API de OCR pode reconhecer imagens digitalizadas, fotos de smartphones, capturas de tela, áreas de imagens e PDFs digitalizados e retornar resultados nos formatos de troca de dados e documentos mais populares. É totalmente offline e não requer conexão com a internet para funcionar. A API requer um esforço mínimo para começar e uma curva de aprendizado superficial para dominar. Todo o pré-processamento, correção de distorção, remoção de ruído, detecção de idioma, multi-threading e outras tarefas complexas são executadas automaticamente, mas podem ser ajustadas para lidar com casos difíceis.

Recursos avançados da API C++ OCR

Extrai texto de imagens e cria PDFs pesquisáveis

Suporta qualquer imagem que você possa obter de um scanner ou câmera

Lê scripts latinos e cirílicos estendidos

Reconhece mais de 6.000 caracteres chineses

Detecta e reconhece todos os tipos de letra e formatação populares

Pré-processa as imagens antes do reconhecimento

Processa toda a imagem ou apenas áreas selecionadas

Suporta imagens giradas, distorcidas e ruidosas

Reconhecimento em lote de todas as imagens em uma pasta ou arquivo

Reconhece imagens fornecidas como links da web

Encontra e corrige automaticamente palavras com erros ortográficos

Obter resultado de reconhecimento como JSON

Fácil de usar

Você ainda acha que o C++ OCR é difícil? Com nossa biblioteca, você só precisa de 5 linhas de código para reconhecer a imagem e exibir o resultado. Experimente este código e veja por si mesmo:

Imagem para texto em 5 linhas - C++

// Forneça o caminho da imagem
std::string image_path = "../Data/Source/sample.png";

// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Faça a mágica
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Exibir o resultado do reconhecimento
std::wcout << buffer << L"\n";

26 Idiomas de Reconhecimento

A API OCR pode reconhecer um grande número de idiomas e todos os scripts de escrita populares, incluindo textos com idiomas mistos.

  • Alfabeto latino estendido : croata, tcheco, dinamarquês, holandês, inglês, estoniano, finlandês, francês, alemão, italiano, letão, lituano, norueguês, polonês, português, romeno, eslovaco, esloveno, espanhol, sueco.
  • Alfabeto cirílico : bielorrusso, búlgaro, cazaque, russo, sérvio, ucraniano.
  • Chinês : mais de 6.000 caracteres.

Você pode deixar a detecção de idioma para a biblioteca ou definir o idioma você mesmo para aumentar o desempenho e a confiabilidade do reconhecimento.

Processamento em lote

A API OCR libera você de reconhecer cada imagem uma por uma, oferecendo vários métodos de processamento em lote que permitem reconhecer várias imagens em uma chamada:

  • Reconhecimento de arquivos PDF e TIFF de várias páginas.
  • Reconhecimento de todos os arquivos em uma pasta.
  • Reconhecimento de todos os arquivos em um arquivo.

Reconhecer arquivo ZIP - C++

// Fornecer caminho de arquivo
std::string archive_path = "book.zip";

// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Inicialize o objeto RecognitionSettings com valores padrão
RecognitionSettings settings;

// Reconhecer
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Preservar formatação

A biblioteca OCR lê todos os tipos de letra populares, como Arial, Times New Roman, Courier New, Tahoma, Calibri e muito mais nos estilos regular, negrito e itálico e preserva cuidadosamente a formatação nos resultados de OCR. Você também pode dividir os resultados do reconhecimento em linhas e detectar áreas de texto em uma página.

Reconhecer fotos

A adoção generalizada de aplicativos OCR geralmente é interrompida pelo fato de que os scanners não são comuns para a maioria dos usuários. Nossa biblioteca de OCR possui poderosos filtros de pré-processamento de imagem integrados que podem lidar com imagens escuras, giradas, distorcidas e ruidosas. Em combinação com suporte para todos os formatos de imagem, permite o reconhecimento confiável até mesmo de fotos de smartphones. A maior parte do pré-processamento e correção da imagem é feita automaticamente, então você só terá que intervir em casos difíceis.

Definir ângulo personalizado para correção de inclinação - C++

// Imagem original
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Ajustar o ângulo de inclinação
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Reconhecer imagem
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Verificação ortográfica

Embora o OCR produza resultados confiáveis, poeira e defeitos de impressão podem fazer com que alguns símbolos sejam reconhecidos incorretamente. A API OCR possui um corretor ortográfico integrado que substitui automaticamente palavras com erros ortográficos e libera você de ter que corrigir manualmente os resultados do reconhecimento.

  
  
  

O Aspose também oferece APIs OCR nativas para outras linguagens de programação populares: