Por que escolher a biblioteca Aspose OCR para Java?

Desbloqueie OCR poderoso com a biblioteca Aspose OCR Java. Nossa API Java é uma API de OCR eficiente, fácil de usar e econômica. Em apenas cinco linhas de código Java, adicione funcionalidade poderosa de OCR aos seus aplicativos sem a necessidade de entender redes neurais e outros detalhes técnicos.

Nosso mecanismo de OCR oferece velocidade e precisão incomparáveis, suportando mais de 130 idiomas, incluindo inglês. , cirílico, árabe, persa, chinês, japonês, coreano, hindi, tâmil e muito mais. Quer você trabalhe com digitalizações, fotos de smartphones, capturas de tela ou PDFs, nosso OCR extrai texto e gera resultados em todos os formatos populares.
O pré-processamento de imagem corrige automaticamente imagens giradas, borradas, invertidas e com ruído para garantir a mais alta precisão de reconhecimento sob quaisquer condições.

Illustration ocr

OCR rápido e preciso

Obtenha resultados de OCR precisos e de alta velocidade com nossa avançada tecnologia Java.

Suporte multilíngue

Reconheça texto em mais de 140 idiomas, incluindo inglês, francês, cirílico, árabe, persa, índico, chinês, japonês, coreano, tâmil e outros scripts.

Todas as imagens

Processe imagens de diversas fontes, como scanners, câmeras e smartphones.

Detecção de idioma misto

Reconheça documentos escritos em idiomas mistos, como chinês/inglês, árabe/francês, hindi/inglês e cirílico/inglês.

Qualquer fonte, estilo e formato

Preserve com precisão o layout do texto, detecte a estrutura da tabela e reconheça o texto perfeitamente, independentemente dos estilos de fonte.

Amostra de código ativo

Experimente a simplicidade: transforme imagem em texto em poucas linhas de código Java

Pronto para reconhecer Pronto para reconhecer Solte um arquivo aqui ou clique para navegar *

* Ao enviar seus arquivos ou usar o serviço você concorda com nosso Termos de uso e política de Privacidade.

Resultado de reconhecimento
 

Converter imagem em texto

Explorar mais exemplos >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Plataforma cruzada

O código Aspose Java OCR funciona perfeitamente em qualquer plataforma compatível com Java SE 6.0 ou superior – seja uma máquina local, um servidor web ou a nuvem .

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de arquivo suportados

Aspose.OCR for Java pode trabalhar com qualquer arquivo você pode obter de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados ​​em tempo real.

Imagens

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR em lote

  • Multi-page PDF
  • ZIP
  • Folder

Resultados de reconhecimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Fácil instalação

Aspose.OCR for Java é distribuído como um arquivo Java Archive (JAR) leve ou como um arquivo para download com dependências mínimas. Basta instalá-lo em seu projeto e você estará pronto para reconhecer textos em vários idiomas suportados e salvar os resultados do reconhecimento em vários formatos.

Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional e sem limitações.

Funciona em qualquer lugar

Nossa biblioteca Java oferece suporte total ao Java SE 6 ou superior, permitindo que seus aplicativos sejam executados perfeitamente em qualquer plataforma – desktop Windows, Windows Server, macOS, Linux e nuvem.

Mais de 140 idiomas de reconhecimento

Nossa biblioteca Java OCR é uma solução universal para processamento de documentos, extração de dados e digitalização de conteúdo em escala global. Com suporte para uma vasta gama de escritas europeias, do Médio Oriente e da Ásia, é bem adaptado a qualquer país e negócio.

Aspose OCR para Java reconhece texto em documentos multilíngues, como chinês/inglês, árabe/francês ou cirílico/inglês. Os seguintes idiomas são suportados:

  • Latim estendido: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
  • Alfabeto Cirílico: Russo, Ucraniano, Cazaque, Búlgaro, incluindo textos mistos em Cirílico/Inglês;
  • Árabe, Persa, Urdu, incluindo textos misturados com Inglês;
  • Línguas chinesa, coreana, japonesa, devanágari e dravidiana, incluindo hindi, tâmil, marata e outras.

Recursos e capacidades

Aspose.OCR for Java Explore os recursos e capacidades avançadas do Aspose OCR para Java.

Feature icon

OCR de fotos

Extraia texto de fotos de smartphones com precisão de digitalização.

Feature icon

PDF pesquisável

Converta qualquer digitalização em um documento pesquisável e editável.

Feature icon

Reconhecimento de URL

Reconheça uma imagem do URL sem baixá-la localmente.

Feature icon

Reconhecimento em massa

Leia todas as imagens de documentos, pastas e arquivos de várias páginas.

Feature icon

Qualquer fonte e estilo

Identifique e reconheça texto em todos os tipos e estilos populares.

Feature icon

Reconhecimento de ajuste fino

Ajuste todos os parâmetros de OCR para obter melhores resultados de reconhecimento.

Feature icon

Corretor ortográfico

Melhore os resultados corrigindo automaticamente palavras com erros ortográficos.

Feature icon

Encontre texto em imagens

Pesquise texto ou expressão regular em um conjunto de imagens.

Feature icon

Compare textos de imagens

Compare textos em duas imagens, independentemente do caso e do layout.

Feature icon

Mundialmente

Extraia texto de qualquer idioma com detecção automática de idioma.

Feature icon

Extração de detalhes principais

Extraia automaticamente detalhes importantes de cartões de identificação.

Feature icon

Integração total com soluções Aspose

Integre o OCR perfeitamente com outros produtos Aspose para obter uma solução Java abrangente e eficiente.

Amostras de código

Explore os exemplos de código para saber como integrar perfeitamente a API OCR em seus aplicativos Java.

Instalação

Como um arquivo Java Archive (JAR) com dependências mínimas ou do repositório Maven, o Aspose OCR for Java é facilmente distribuído. A integração ao seu projeto, diretamente do seu ambiente de desenvolvimento integrado (IDE) Java preferido, é um processo contínuo. Basta instalá-lo e você estará preparado para aproveitar a gama completa de recursos de OCR, salvando os resultados de reconhecimento em qualquer um dos formatos suportados.

Após a instalação, você pode começar imediatamente a usar o Aspose.OMR for Java , embora com certas limitações. Uma licença temporária elimina todas as restrições da versão de teste por 30 dias. Utilize este período para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra do Aspose.OCR para Java posteriormente.

Reconhecer texto em imagens digitalizadas em Java

Supere o desafio dos aplicativos de OCR que não possuem scanners difundidos. Nossa API possui poderosos filtros de pré-processamento de imagem integrados que lidam habilmente com imagens giradas, distorcidas e com ruído. Combinado com suporte para todos os formatos de imagem, garante reconhecimento confiável mesmo em fotos de smartphones. A maior parte do pré-processamento e da correção de imagens são automatizados, exigindo sua intervenção apenas em casos desafiadores.

Aplicar correções automáticas de imagem - Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

Extraia texto de fotos em Java

Integre detecção e reconhecimento de texto em seus aplicativos Java. Acesse resultados precisos de fotos com facilidade, aprimorando seus recursos de processamento de imagens. Eleve as capacidades de processamento de imagens, obtendo resultados precisos a partir de fotos.

Detectar e reconhecer texto na foto - Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Otimização de Recursos em Java

O reconhecimento óptico de caracteres exige recursos. Nossa API oferece maneiras flexíveis de equilibrar a clássica tríade tempo-preço-qualidade. Ele permite restringir o número de threads utilizados pelo mecanismo de reconhecimento. Embora esse ajuste possa levar a uma velocidade de reconhecimento mais lenta, ele permite alocar recursos para tarefas simultâneas, como processamento paralelo de imagens, operações de servidor web, gerenciamento de banco de dados ou análise de dados em segundo plano.

  • Escolha entre reconhecimento completo e reconhecimento rápido.
  • Especifique o número de threads alocados para reconhecimento ou permita que a biblioteca seja dimensionada automaticamente para o número de núcleos do processador.
  • Libere a CPU transferindo cálculos para a GPU.

Equilibrando o uso de recursos

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

Reconhecimento rápido com configuração mínima

Se suas imagens forem digitalizadas de alta qualidade sem distorções ou distorções, você poderá usar o modo de reconhecimento mais rápido que consome o mínimo de recursos possíveis usando:

OCR de reconhecimento rápido - Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});