HTML JPG OCR XML BMP
Aspose.OCR  para C++
Searchable PDF

Aspose.Imaging for Java

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato BMP e cria documentos BMP contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR

Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Com OCR C++ e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem BMP em um documento Searchable PDF:

  • Crie uma instância da classe AsposeOcr
  • Chama o método AsposeOCR.asposeocr_page()
  • Passe o caminho do arquivo BMP como parâmetro
  • AsposeOCR.asposeocr_page retorna uma String ou arquivo do tipo Searchable PDF

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que Microsoft.ML.OnnxRuntime 1.7.0 ou superior foi adicionado ao projeto. Ele deve ser instalado automaticamente se você instalar o Aspose.OCR por meio do NuGet Package Manager.

  • Solução compatível com NET Standard 2.0+
  • Aspose.OCR para .NET referenciado em seu projeto.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • BMP O que é BMP Formato de arquivo

    Arquivos com extensão .BMP representam arquivos de imagem de bitmap que são usados ​​para armazenar imagens digitais de bitmap. Essas imagens são independentes do adaptador gráfico e também são chamadas de formato de arquivo de bitmap independente de dispositivo (DIB). Essa independência serve para abrir o arquivo em várias plataformas, como Microsoft Windows e Mac. O formato de arquivo BMP pode armazenar dados como imagens digitais bidimensionais em formato monocromático e colorido com várias profundidades de cor.

    consulte Mais informação

    Searchable PDF O que é Searchable PDF Formato de arquivo

    Os arquivos PDF pesquisáveis ​​retêm a imagem digitalizada original para visualização, bem como o texto OCR em uma camada oculta que pode ser usada para pesquisas de texto completo em um documento ou realce de texto para operações de copiar e colar. A conversão OCR completa para PDF, sem incluir a imagem original, nunca reterá 100% da formatação original, especialmente se o documento tiver muitas imagens ou um layout complexo.

    consulte Mais informação

    TXT (Arquivo de documento de texto)
    Text (Arquivo de documento de texto)
    DOC (Documentos gerados pelo Microsoft Word)
    DOCX (Documentos do Microsoft Word)
    XLS (Formato de arquivo binário do Microsoft Excel)
    XLSX (Documentos do Microsoft Excel)
    PDF (Formato de Documento Portátil (PDF))
    Searchable PDF (Gráficos de rede portáteis pesquisáveis)