Magia do OCR: imagem para texto
Transformar imagens em texto - Java
Mais vitrines >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Por que escolher Aspose.OCR para Java?
Descubra o mundo integrado do Aspose.OCR para Java – uma API de OCR potente, fácil de usar e econômica. Com menos de 5 linhas de código Java, adicione funcionalidade OCR aos seus aplicativos sem se aprofundar em matemática complexa ou redes neurais. Nosso robusto mecanismo de OCR possui velocidade e precisão superiores, suportando 28 idiomas, incluindo escritas latinas, cirílicas e chinesas. De imagens digitalizadas e fotos de smartphones a capturas de tela e PDFs digitalizados, recupere resultados em formatos populares de troca de documentos e dados. Aproveite os filtros de pré-processamento que lidam com imagens giradas, distorcidas e com ruído. Otimize o desempenho de reconhecimento e a carga do sistema transferindo tarefas que consomem muitos recursos para a GPU.
OCR rápido e preciso
Obtenha resultados de OCR precisos e de alta velocidade com nossa avançada tecnologia Java.
Suporte multilíngue
Reconheça texto em 28 idiomas, incluindo escrita latina, cirílica e chinesa.
Suporte de imagem adaptável
Processe imagens de diversas fontes, como scanners, câmeras e smartphones.
Domínio dos caracteres chineses
Reconheça mais de 6.000 caracteres chineses com precisão incomparável.
Estilos de fonte e integridade de formato
Preserve estilos de fonte e formatação para representação fiel de texto Java reconhecido.
Amostra de código ativo
Experimente a simplicidade: transforme imagem em texto em poucas linhas de código Java!
* Ao enviar seus arquivos ou usar o serviço você concorda com nosso Termos de uso e política de Privacidade.
Converter imagem em texto
Explore mais exemplos >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Java em todos os lugares
Aspose.OCR for Java funciona perfeitamente em qualquer plataforma que suporte Java SE 6.0 ou superior – seja uma máquina local, um servidor web ou o nuvem.
Formatos de arquivo suportados
Aspose.OCR for Java pode trabalhar com praticamente qualquer arquivo você pode obter de um scanner ou câmera. Os resultados do reconhecimento são retornados nos formatos mais populares de arquivos e troca de dados que podem ser salvos, importados para um banco de dados ou analisados em tempo real.
Imagens
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR em lote
- Multi-page PDF
- ZIP
- Folder
Resultados de reconhecimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalação sem esforço
Aspose.OCR for Java é distribuído como um arquivo Java Archive (JAR) leve ou como um arquivo para download com dependências mínimas. Basta instalá-lo em seu projeto e você estará pronto para reconhecer textos em vários idiomas suportados e salvar os resultados do reconhecimento em vários formatos.
Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional e sem limitações.
Java, em qualquer lugar
Nossa biblioteca oferece suporte total ao Java SE 6 ou superior, permitindo que seus aplicativos sejam executados perfeitamente em qualquer plataforma – desktop Windows, Windows Server, macOS, Linux e nuvem.
28 idiomas de reconhecimento
Nossa API Java OCR reconhece inúmeras linguagens e scripts de escrita populares, incluindo linguagens mistas:
Deixe a detecção de idioma para a biblioteca ou defina você mesmo o idioma para melhorar o desempenho e a confiabilidade do reconhecimento.
- Alfabeto latino estendido: croata, tcheco, dinamarquês, holandês, inglês, estoniano, finlandês, francês, alemão, italiano, letão, lituano, norueguês, polonês, português, romeno, eslovaco, esloveno, espanhol, sueco;
- Alfabeto Cirílico: Bielorrusso, Búlgaro, Cazaque, Russo, Sérvio, Ucraniano;
- Mais de 6.000 caracteres chineses;
- Hindi.
Capacitando Recursos e Capacidades
Aspose.OCR for Java Explore os recursos e capacidades avançadas do Aspose.OCR para Java.
OCR de fotos
Extraia texto de fotos de smartphones com precisão de digitalização.
PDF pesquisável
Converta qualquer digitalização em um documento totalmente pesquisável e indexável.
Reconhecimento de URL
Reconheça uma imagem do URL sem baixá-la localmente.
Reconhecimento em massa
Leia todas as imagens de documentos, pastas e arquivos de várias páginas.
Qualquer fonte e estilo
Identifique e reconheça texto em todos os tipos e estilos populares.
Reconhecimento de ajuste fino
Ajuste todos os parâmetros de OCR para obter melhores resultados de reconhecimento.
Verificador ortográfico
Melhore os resultados corrigindo automaticamente palavras com erros ortográficos.
Encontre texto em imagens
Pesquise texto ou expressão regular em um conjunto de imagens.
Compare textos de imagens
Compare textos em duas imagens, independentemente do caso e do layout.
Reconhecimento de imagem de link da web
Reconheça imagens diretamente de links da web, aprimorando a integração de OCR em seus projetos Java.
Correção automática de palavras com erros ortográficos
Melhore os resultados de OCR corrigindo automaticamente palavras com erros ortográficos, garantindo precisão em seus aplicativos Java.
Integração total com ecossistema Aspose
Integre Aspose.OCR for Java perfeitamente com outros produtos Aspose para obter uma solução Java abrangente e eficiente.
Amostras de código
Explore os exemplos de código para aprender como integrar perfeitamente o Aspose.OCR for Java em seus aplicativos.
Instalação
Após a instalação, você pode começar imediatamente a usar o Aspose.OMR for Java , embora com certas limitações. Uma licença temporária elimina todas as restrições da versão de teste por 30 dias. Utilize este período para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra do Aspose.OCR para Java posteriormente.
Reconhecer texto em imagens digitalizadas em Java
Supere o desafio dos aplicativos de OCR que não possuem scanners difundidos. Nossa API possui poderosos filtros de pré-processamento de imagem integrados que lidam habilmente com imagens giradas, distorcidas e com ruído. Combinado com suporte para todos os formatos de imagem, garante reconhecimento confiável mesmo em fotos de smartphones. A maior parte do pré-processamento e da correção de imagens são automatizados, exigindo sua intervenção apenas em casos desafiadores.
Aplicar correções automáticas de imagem - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Extraia texto de fotos em Java
Integre detecção e reconhecimento de texto em seus aplicativos Java. Acesse resultados precisos de fotos com facilidade, aprimorando seus recursos de processamento de imagens. Eleve as capacidades de processamento de imagens, obtendo resultados precisos a partir de fotos.
Detectar e reconhecer texto na foto - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Otimização de recursos em Java
O reconhecimento óptico de caracteres exige recursos. Nossa API oferece maneiras flexíveis de equilibrar a clássica tríade tempo-preço-qualidade. Ele permite restringir o número de threads utilizados pelo mecanismo de reconhecimento. Embora esse ajuste possa levar a uma velocidade de reconhecimento mais lenta, ele permite alocar recursos para tarefas simultâneas, como processamento paralelo de imagens, operações de servidor web, gerenciamento de banco de dados ou análise de dados em segundo plano.
- Escolha entre reconhecimento completo e reconhecimento rápido.
- Especifique o número de threads alocados para reconhecimento ou permita que a biblioteca seja dimensionada automaticamente para o número de núcleos do processador.
- Libere a CPU transferindo cálculos para a GPU.
Equilibrando o uso de recursos
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
Reconhecimento rápido com configuração mínima
Se suas imagens forem digitalizadas de alta qualidade sem distorções ou distorções, você poderá usar o modo de reconhecimento mais rápido que consome o mínimo de recursos possíveis usando:
OCR de reconhecimento rápido - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});