Converta a imagem em texto com Python OCR API via Java
Reconhecer o texto em imagens com python
Mais exibições ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Por que asppor.ocr for Python via Java?
Aspose.ocr for python via java integra perfeitamente os poderosos recursos de reconhecimento de caracteres ópticos (OCR) nos seus notebooks e aplicativos de plataforma cruzada. Com nossa API intuitiva e de alta velocidade, você pode extrair texto sem esforço de digitalizações, capturas de tela, links da Web ou fotos de smartphones, fornecendo resultados prontos para consolidação, análise ou armazenamento. Reconheça imagens digitalizadas, fotos de smartphones, capturas de tela e PDFs digitalizados, economizando resultados em formatos de documentos populares. Os filtros avançados de pré-processamento de imagens rotacionadas, distorcidas e barulhentas. Otimize o desempenho descarregando tarefas para a GPU.

OCR rápido e preciso
A obtenção de resultados de OCR de alta velocidade e precisão com nosso Python avançado via tecnologia Java.
Suporte multilíngue
Reconheça o texto em mais de 140 idiomas, incluindo scripts latinos, cirílicos, árabes, persas, indic e chineses, garantindo versatilidade para suas aplicações Python via Java.
Suporte de imagem flexível
Processar imagens de scanners, câmeras e smartphones perfeitamente com Python via Java.
Precisão no reconhecimento de caracteres chinês
Reconheça mais de 6.000 caracteres chineses com precisão em seus projetos Python via Java.
Preservar estilos de fonte e formatação
Mantenha os estilos de fonte e a formatação para uma representação precisa do texto reconhecido em seus aplicativos Python via Java.
Amostra de código vivo
Inicie o reconhecimento de texto a partir de imagens em apenas três linhas de código. Experimente a simplicidade!
* Enviando seus arquivos ou usando o serviço com o qual você concorda com o nosso Termos de uso e política de Privacidade.
Converter imagem em texto
Mais exemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Escolha sua preferência
Escolha a biblioteca certa para suas necessidades. Explore as APIs disponíveis e seus recursos para selecionar a solução mais eficiente.
Versatilidade
Python via .NET
Uniformidade
Python via Java
Desempenho
Python via C++
Java Compatibilidade de back -end
Projetado como um módulo Python, nossa biblioteca garante a compatibilidade entre os principais sistemas operacionais que suportam java - incluindo Microsoft Windows, Linux e MacOS ou as plataformas de nuvem. Isso permite desenvolver aplicativos em uma plataforma e executá -los perfeitamente em outro, eliminando a necessidade de quaisquer modificações de código.
Formatos de arquivo suportados
Aspose.OCR for Python via Java pode trabalhar com qualquer arquivo Você pode ir de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados em tempo real.
Imagens
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Lote ocr
- Multi-page PDF
- ZIP
- Folder
Resultados de reconhecimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalação sem esforço para Python via Java
Aspose.ocr for python via java é entregue como um pacote python ou como um arquivo para download com dependências mínimas. Facilmente Install em seu projeto, e você está pronto para reconhecer textos em vários idiomas suportados e salvar resultados de reconhecimento em vários formatos.
Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional sem limitações.
OCR poderoso para aplicações Python
Nossa biblioteca se integra facilmente, permitindo que os aplicativos Python funcionem perfeitamente em qualquer plataforma - Windows de desktop, servidor Windows, MacOS, Linux e a nuvem.
140+ idiomas de reconhecimento
Nossa API Python e Java OCR reconhece uma infinidade de idiomas e scripts de redação popular, incluindo idiomas mistos:
Deixe a detecção de linguagem na biblioteca ou defina o idioma para obter um desempenho e confiabilidade aprimorados de reconhecimento.
- ** Latim estendido ** alfabeto: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
- ** Cirílico ** alfabeto: russo, ucraniano, cazaque, sérvio, Bielorrússia, búlgaro;
- Árabe, persa, urdu;
- Script chinês e devanagari, incluindo hindi, marathi, bhojpuri e outros.
Filtros aprimorados de processamento de imagem
A precisão do reconhecimento óptico de caracteres depende muito da qualidade da imagem original. Aspose.ocr for Python via Java oferece uma ampla variedade de filtros de processamento de imagens automatizados e manuais para otimizar uma imagem antes de enviar ao mecanismo OCR:
- Endireitar automaticamente imagens ligeiramente inclinadas.
- Corrija manualmente a rotação de imagens severamente distorcidas.
- Remova automaticamente sujeira, manchas, arranhões, brilho, gradientes indesejados e outros tipos de ruído.
- Ajuste automaticamente o contraste da imagem.
- Reduzir a imagem automaticamente de luxo ou manualmente.
- Converta imagens em preto e branco ou em escala de cinza.
- As cores invertidas da imagem, fazendo com que as áreas claras pareçam as áreas escuras e escuras pareçam claras.
- Aumente a espessura dos caracteres em uma imagem.
- Imagens desfocadas e ruidosas ao preservar as bordas das letras.
- Endurecer a inclinação da página e a distorção correta da lente da câmera nas fotos da página.
APIs especilizadas para vários tipos de documentos
Aspose.ocr for python via java oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com precisão máxima:
- Digitalizar ou fotografar cartões de identificação e passaportes.
- Placas de veículos.
- Faturas.
- Recibos.
Verificador ortográfico embutido
Embora Aspose.ocr for Python via Java forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes não padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados do reconhecimento, você pode ativar o verificador ortográfico, que encontra e corrige automaticamente os erros de ortografia com base no idioma de reconhecimento selecionado.
Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estão presentes nos dicionários de ortografia comuns, você poderá fornecer suas próprias listas de palavras.
Reconhecimento eficiente em lote
Our Python OCR API empowers you to streamline image recognition. Utilize métodos versáteis de processamento de lote para processamento eficiente de várias imagens em uma única chamada:
- Reconheça os arquivos PDF de várias páginas, TIFF.
- Processe todos os arquivos em uma pasta.
- Lidar com o reconhecimento de todos os arquivos em um arquivo.
- Reconhecer imagens de uma lista especificada.
Aprendendo através de exemplos de Python
Explore uma variedade de exemplos de python projetados para ajudá-lo a entender rapidamente as funções e recursos de nossa solução OCR. Quickly gain insight into creating customized solutions that meet your specific business requirements.
Recursos e recursos
Aspose.OCR for Python via Java Explore as características avançadas do Aspose.ocr for Python
Foto OCR
Extraia o texto das fotos de smartphones com precisão no nível da verificação.
PDF pesquisável
Converta qualquer varredura em um documento totalmente pesquisável e indexável.
Reconhecimento de URL
Reconheça uma imagem do URL sem baixá -la localmente.
Reconhecimento em massa
Leia todas as imagens de documentos, pastas e arquivos de várias páginas.
Qualquer fonte e estilo
Identifique e reconheça o texto em todos os tipos e estilos populares.
Reconhecimento fino
Ajuste todos os parâmetros OCR para obter os melhores resultados de reconhecimento.
Verificador ortográfico
Melhorar os resultados corrigindo automaticamente as palavras incorretas.
Encontre texto em imagens
Procure texto ou expressão regular dentro de um conjunto de imagens.
Compare textos de imagem
Compare textos em duas imagens, independentemente do caso e do layout.
Amostras de código Python
Descubra amostras de código para integrar perfeitamente aspose.ocr for python via java em seus aplicativos.
Instalação sem esforço
Como um pacote python ou um arquivo para download com dependências mínimas, Aspose.ocr for Python via Java garante distribuição fácil. Integrore-o ao seu projeto diretamente do Python e você está preparado para aproveitar os recursos completos do OCR, economizando resultados de reconhecimento em vários formatos. Uma licença temporária remove todas as restrições da versão de avaliação por 30 dias. Utilize esse período para iniciar o desenvolvimento de um aplicativo de OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra de Aspose.ocr for Python via Java posteriormente.
Carregar licença
lic = License()
lic.set_license(self.licPath)
Reconhecimento de imagem
O principal desafio nos aplicativos OCR é a escassez de scanners para usuários finais. Nossa API, perfeitamente integrada ao Python via Java, apresenta robustos filtros de pré-processamento de imagem robustos que manuseiam imagens giradas, distorcidas e barulhentas. Combinado com o suporte para todos os formatos de imagem, ele permite um reconhecimento confiável, mesmo nas fotos de smartphones. A maioria dos pré-processamento e correção da imagem é automatizada, exigindo sua intervenção apenas em casos desafiadores.
Aplicar correções automáticas de imagem - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Conversor universal python
Nossa API lê adepto qualquer imagem de scanners, câmeras ou smartphones: documentos em PDF, JPEG, PNG, TIFF, GIF, arquivos BMP. Suporte total para documentos em PDF de várias páginas, TIFF e imagens DJVU garante a versatilidade. Você também pode fornecer uma imagem da Web por meio de um URL.
Os resultados de reconhecimento
são retornados nos formatos populares de documentos e trocas de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Reconheça o PDF e salve resultados em vários formatos de saída - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Otimizando o uso de recursos
O OCR oferece um algoritmo de reconhecimento especial para extrair conteúdo de imagens com texto esparso e fundo barulhento/colorido. Este método melhora significativamente a precisão do OCR nos seguintes casos de negócios:
- Leia o texto das fotos da rua.
- Segmentar e identificar sinais de trânsito e placas nas imagens da rua.
- Localize as tags de preço e interprete o texto extraído como preços.
- Encontre e agregados regiões de interesse nas etiquetas de alimentos, como informações nutricionais ou listas de ingredientes.
- Identifique e analise as placas de carros.
- Extraia o texto de menus e catálogos.
Área aberta OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extraindo texto das fotos de rua
O OCR for Python oferece um algoritmo de reconhecimento especial que extrai texto de placas de veículos, incluindo fotos escuras e embaçadas. O texto resultante pode ser salvo automaticamente no banco de dados ou verificado automaticamente.
Reconhecer o número do carro - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)