processa imagens digitalizadas ou até mesmo fotos de smartphones no formato TIFF e cria documentos TIFF contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR
Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Com OCR C++ e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem TIFF em um documento Searchable PDF:
- Crie uma instância da classe AsposeOcr
- Chama o método AsposeOCR.asposeocr_page()
- Passe o caminho do arquivo TIFF como parâmetro
- AsposeOCR.asposeocr_page retorna uma String ou arquivo do tipo Searchable PDF
Requisitos de sistema
Antes de executar o exemplo, certifique-se de que Microsoft.ML.OnnxRuntime 1.7.0 ou superior foi adicionado ao projeto. Ele deve ser instalado automaticamente se você instalar o Aspose.OCR por meio do NuGet Package Manager.
- Solução compatível com NET Standard 2.0+
- Aspose.OCR para .NET referenciado em seu projeto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
TIFF O que é TIFF Formato de arquivo
TIFF ou TIF, Tagged Image File Format, representa imagens raster que se destinam ao uso em uma variedade de dispositivos que estão em conformidade com este padrão de formato de arquivo. Ele é capaz de descrever dados de imagem de dois níveis, tons de cinza, cores de paleta e cores em vários espaços de cores. Ele suporta esquemas de compactação com e sem perdas para escolher entre espaço e tempo para aplicativos que usam o formato. O formato é extensível e passou por várias revisões que permitem a inclusão de uma quantidade ilimitada de informações privadas ou de finalidade especial. O formato não depende da máquina e está livre de limites como processador, sistema operacional ou sistemas de arquivos.
consulte Mais informaçãoSearchable PDF O que é Searchable PDF Formato de arquivo
Os arquivos PDF pesquisáveis retêm a imagem digitalizada original para visualização, bem como o texto OCR em uma camada oculta que pode ser usada para pesquisas de texto completo em um documento ou realce de texto para operações de copiar e colar. A conversão OCR completa para PDF, sem incluir a imagem original, nunca reterá 100% da formatação original, especialmente se o documento tiver muitas imagens ou um layout complexo.
consulte Mais informação