HTML JPG OCR XML BMP

Searchable PDF

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato PDF e cria documentos PDF contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR

Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .

Package Manager Console Command
  PM> Install-Package Aspose.OCR.Cpp

Com OCR C++ e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem PDF em um documento Searchable PDF:

Crie uma instância da classe AsposeOcr
Chama o método AsposeOCR.asposeocr_page()
Passe o caminho do arquivo PDF como parâmetro
AsposeOCR.asposeocr_page retorna uma String ou arquivo do tipo Searchable PDF

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que Microsoft.ML.OnnxRuntime 1.7.0 ou superior foi adicionado ao projeto. Ele deve ser instalado automaticamente se você instalar o Aspose.OCR por meio do NuGet Package Manager.

Solução compatível com NET Standard 2.0+
Aspose.OCR para .NET referenciado em seu projeto.

std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";

PDF O que é PDF Formato de arquivo

Portable Document Format (PDF) é um tipo de documento criado pela Adobe na década de 1990. O objetivo deste formato de arquivo foi introduzir um padrão para representação de documentos e outros materiais de referência em um formato independente do software aplicativo, hardware e sistema operacional. O formato de arquivo PDF tem capacidade total para conter informações como texto, imagens, hiperlinks, campos de formulário, rich media, assinaturas digitais, anexos, metadados, recursos geoespaciais e objetos 3D que podem se tornar parte do documento de origem.

consulte Mais informação

Searchable PDF O que é Searchable PDF Formato de arquivo

Os arquivos PDF pesquisáveis retêm a imagem digitalizada original para visualização, bem como o texto OCR em uma camada oculta que pode ser usada para pesquisas de texto completo em um documento ou realce de texto para operações de copiar e colar. A conversão OCR completa para PDF, sem incluir a imagem original, nunca reterá 100% da formatação original, especialmente se o documento tiver muitas imagens ou um layout complexo.

consulte Mais informação

Aspose.OCR para C++

Overview

Package Manager Console Command

Requisitos de sistema

PDF O que é PDF Formato de arquivo

Searchable PDF O que é Searchable PDF Formato de arquivo