Imagem para texto com Java OCR API
Transforme imagens em texto em Java
Mais vitrines >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Por que escolher a biblioteca Aspose OCR para Java?
Desbloqueie OCR poderoso com a biblioteca Aspose OCR Java. Nossa API Java é uma API de OCR eficiente, fácil de usar e econômica. Em apenas cinco linhas de código Java, adicione funcionalidade poderosa de OCR aos seus aplicativos sem a necessidade de entender redes neurais e outros detalhes técnicos.
Nosso mecanismo de OCR oferece velocidade e precisão incomparáveis, suportando mais de 130 idiomas, incluindo inglês. , cirílico, árabe, persa, chinês, japonês, coreano, hindi, tâmil e muito mais. Quer você trabalhe com digitalizações, fotos de smartphones, capturas de tela ou PDFs, nosso OCR extrai texto e gera resultados em todos os formatos populares.
O pré-processamento de imagem corrige automaticamente imagens giradas, borradas, invertidas e com ruído para garantir a mais alta precisão de reconhecimento sob quaisquer condições.
OCR rápido e preciso
Obtenha resultados de OCR precisos e de alta velocidade com nossa avançada tecnologia Java.
Suporte multilíngue
Reconheça texto em mais de 140 idiomas, incluindo inglês, francês, cirílico, árabe, persa, índico, chinês, japonês, coreano, tâmil e outros scripts.
Todas as imagens
Processe imagens de diversas fontes, como scanners, câmeras e smartphones.
Detecção de idioma misto
Reconheça documentos escritos em idiomas mistos, como chinês/inglês, árabe/francês, hindi/inglês e cirílico/inglês.
Qualquer fonte, estilo e formato
Preserve com precisão o layout do texto, detecte a estrutura da tabela e reconheça o texto perfeitamente, independentemente dos estilos de fonte.
Amostra de código ativo
Experimente a simplicidade: transforme imagem em texto em poucas linhas de código Java
* Ao enviar seus arquivos ou usar o serviço você concorda com nosso Termos de uso e política de Privacidade.
Converter imagem em texto
Explorar mais exemplos >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Plataforma cruzada
O código Aspose Java OCR funciona perfeitamente em qualquer plataforma compatível com Java SE 6.0 ou superior – seja uma máquina local, um servidor web ou a nuvem .
Formatos de arquivo suportados
Aspose.OCR for Java pode trabalhar com qualquer arquivo você pode obter de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados em tempo real.
Imagens
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR em lote
- Multi-page PDF
- ZIP
- Folder
Resultados de reconhecimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Fácil instalação
Aspose.OCR for Java é distribuído como um arquivo Java Archive (JAR) leve ou como um arquivo para download com dependências mínimas. Basta instalá-lo em seu projeto e você estará pronto para reconhecer textos em vários idiomas suportados e salvar os resultados do reconhecimento em vários formatos.
Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional e sem limitações.
Funciona em qualquer lugar
Nossa biblioteca Java oferece suporte total ao Java SE 6 ou superior, permitindo que seus aplicativos sejam executados perfeitamente em qualquer plataforma – desktop Windows, Windows Server, macOS, Linux e nuvem.
Mais de 140 idiomas de reconhecimento
Nossa biblioteca Java OCR é uma solução universal para processamento de documentos, extração de dados e digitalização de conteúdo em escala global. Com suporte para uma vasta gama de escritas europeias, do Médio Oriente e da Ásia, é bem adaptado a qualquer país e negócio.
Aspose OCR para Java reconhece texto em documentos multilíngues, como chinês/inglês, árabe/francês ou cirílico/inglês. Os seguintes idiomas são suportados:
- Latim estendido: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
- Alfabeto Cirílico: Russo, Ucraniano, Cazaque, Búlgaro, incluindo textos mistos em Cirílico/Inglês;
- Árabe, Persa, Urdu, incluindo textos misturados com Inglês;
- Línguas chinesa, coreana, japonesa, devanágari e dravidiana, incluindo hindi, tâmil, marata e outras.
Recursos e capacidades
Aspose.OCR for Java Explore os recursos e capacidades avançadas do Aspose OCR para Java.
OCR de fotos
Extraia texto de fotos de smartphones com precisão de digitalização.
PDF pesquisável
Converta qualquer digitalização em um documento pesquisável e editável.
Reconhecimento de URL
Reconheça uma imagem do URL sem baixá-la localmente.
Reconhecimento em massa
Leia todas as imagens de documentos, pastas e arquivos de várias páginas.
Qualquer fonte e estilo
Identifique e reconheça texto em todos os tipos e estilos populares.
Reconhecimento de ajuste fino
Ajuste todos os parâmetros de OCR para obter melhores resultados de reconhecimento.
Corretor ortográfico
Melhore os resultados corrigindo automaticamente palavras com erros ortográficos.
Encontre texto em imagens
Pesquise texto ou expressão regular em um conjunto de imagens.
Compare textos de imagens
Compare textos em duas imagens, independentemente do caso e do layout.
Mundialmente
Extraia texto de qualquer idioma com detecção automática de idioma.
Extração de detalhes principais
Extraia automaticamente detalhes importantes de cartões de identificação.
Integração total com soluções Aspose
Integre o OCR perfeitamente com outros produtos Aspose para obter uma solução Java abrangente e eficiente.
Amostras de código
Explore os exemplos de código para saber como integrar perfeitamente a API OCR em seus aplicativos Java.
Instalação
Após a instalação, você pode começar imediatamente a usar o Aspose.OMR for Java , embora com certas limitações. Uma licença temporária elimina todas as restrições da versão de teste por 30 dias. Utilize este período para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra do Aspose.OCR para Java posteriormente.
Reconhecer texto em imagens digitalizadas em Java
Supere o desafio dos aplicativos de OCR que não possuem scanners difundidos. Nossa API possui poderosos filtros de pré-processamento de imagem integrados que lidam habilmente com imagens giradas, distorcidas e com ruído. Combinado com suporte para todos os formatos de imagem, garante reconhecimento confiável mesmo em fotos de smartphones. A maior parte do pré-processamento e da correção de imagens são automatizados, exigindo sua intervenção apenas em casos desafiadores.
Aplicar correções automáticas de imagem - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Extraia texto de fotos em Java
Integre detecção e reconhecimento de texto em seus aplicativos Java. Acesse resultados precisos de fotos com facilidade, aprimorando seus recursos de processamento de imagens. Eleve as capacidades de processamento de imagens, obtendo resultados precisos a partir de fotos.
Detectar e reconhecer texto na foto - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Otimização de Recursos em Java
O reconhecimento óptico de caracteres exige recursos. Nossa API oferece maneiras flexíveis de equilibrar a clássica tríade tempo-preço-qualidade. Ele permite restringir o número de threads utilizados pelo mecanismo de reconhecimento. Embora esse ajuste possa levar a uma velocidade de reconhecimento mais lenta, ele permite alocar recursos para tarefas simultâneas, como processamento paralelo de imagens, operações de servidor web, gerenciamento de banco de dados ou análise de dados em segundo plano.
- Escolha entre reconhecimento completo e reconhecimento rápido.
- Especifique o número de threads alocados para reconhecimento ou permita que a biblioteca seja dimensionada automaticamente para o número de núcleos do processador.
- Libere a CPU transferindo cálculos para a GPU.
Equilibrando o uso de recursos
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
Reconhecimento rápido com configuração mínima
Se suas imagens forem digitalizadas de alta qualidade sem distorções ou distorções, você poderá usar o modo de reconhecimento mais rápido que consome o mínimo de recursos possíveis usando:
OCR de reconhecimento rápido - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});