Converta imagem em texto com API Python OCR via Java
Reconhecer texto em imagens com Python
Mais vitrines ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Por que Aspose.OCR para Python via Java?
Aspose.OCR para Python via Java integra perfeitamente recursos poderosos de reconhecimento óptico de caracteres (OCR) em seus notebooks e aplicativos Python de plataforma cruzada. Com nossa API intuitiva e de alta velocidade, você pode extrair facilmente texto de digitalizações, capturas de tela, links da web ou fotos de smartphones, fornecendo resultados prontos para consolidação, análise ou armazenamento. Reconheça imagens digitalizadas, fotos de smartphones, capturas de tela e PDFs digitalizados, salvando os resultados em formatos de documentos populares. Filtros avançados de pré-processamento lidam com imagens giradas, distorcidas e com ruído. Otimize o desempenho transferindo tarefas para a GPU.
OCR rápido e preciso
Obtenha resultados de OCR precisos e de alta velocidade com nossa avançada tecnologia Python via Java.
Suporte multilíngue
Reconheça texto em mais de 130 idiomas, incluindo scripts latinos, cirílicos, árabes, persas, índicos e chineses, garantindo versatilidade para seus aplicativos Python via Java.
Suporte flexível para imagens
Processe imagens de scanners, câmeras e smartphones perfeitamente com Python via Java.
Precisão no reconhecimento de caracteres chineses
Reconheça mais de 6.000 caracteres chineses com precisão em seus projetos Python via Java.
Preservar estilos e formatação de fontes
Mantenha estilos de fonte e formatação para representação precisa de texto reconhecido em seus aplicativos Python via Java.
Amostra de código ativo
Inicie o reconhecimento de texto de imagens em apenas três linhas de código. Experimente a simplicidade!
* Ao enviar seus arquivos ou usar o serviço você concorda com nosso Termos de uso e política de Privacidade.
Converter imagem em texto
Mais exemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Escolha sua preferência
Escolha a biblioteca certa para suas necessidades. Explore as APIs disponíveis e seus recursos para selecionar a solução mais eficiente.
Versatilidade
Python via .NET
Uniformidade
Python via Java
Desempenho
Python via C++
Compatibilidade de back-end Java
Projetada como um módulo Python, nossa biblioteca garante compatibilidade com os principais sistemas operacionais compatíveis com Java - incluindo Microsoft Windows, Linux e macOS, ou o plataformas de nuvem. Isso permite desenvolver aplicativos em uma plataforma e executá-los perfeitamente em outra, eliminando a necessidade de quaisquer modificações no código.
Formatos de arquivo suportados
Aspose.OCR for Python via Java pode trabalhar com qualquer arquivo você pode obter de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados em tempo real.
Imagens
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR em lote
- Multi-page PDF
- ZIP
- Folder
Resultados de reconhecimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalação fácil para Python via Java
Aspose.OCR para Python via Java é entregue como um pacote Python ou como um arquivo para download com dependências mínimas. Instale facilmente em seu projeto e você estará pronto para reconhecer textos em vários idiomas suportados e salvar resultados de reconhecimento em vários formatos.
Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional e sem limitações.
OCR poderoso para aplicativos Python
Nossa biblioteca se integra facilmente, permitindo que aplicativos Python sejam executados perfeitamente em qualquer plataforma – desktop Windows, Windows Server, macOS, Linux e nuvem.
Mais de 130 idiomas de reconhecimento
Nossa API Python e Java OCR reconhece uma infinidade de linguagens e scripts de escrita populares, incluindo linguagens mistas:
Deixe a detecção de idioma para a biblioteca ou defina você mesmo o idioma para melhorar o desempenho e a confiabilidade do reconhecimento.
- Alfabeto latino estendido: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
- Alfabeto cirílico: russo, ucraniano, cazaque, sérvio, bielorrusso, búlgaro;
- Árabe, Persa, Urdu;
- Escrita chinesa e Devanagari, incluindo Hindi, Marathi, Bhojpuri e outras.
Filtros aprimorados de processamento de imagem
A precisão do reconhecimento óptico de caracteres depende muito da qualidade da imagem original. Aspose.OCR para Python via Java oferece uma ampla variedade de filtros de processamento de imagem automatizados e manuais para otimizar uma imagem antes do envio ao mecanismo de OCR:
- Endireite automaticamente imagens ligeiramente inclinadas.
- Corrija manualmente a rotação de imagens muito distorcidas.
- Remova automaticamente sujeira, manchas, arranhões, brilho, gradientes indesejados e outros tipos de ruído.
- Ajusta automaticamente o contraste da imagem.
- Aumente automaticamente ou redimensione manualmente a imagem.
- Converta imagens em preto e branco ou em tons de cinza.
- Inverta as cores da imagem, fazendo com que as áreas claras pareçam escuras e as áreas escuras pareçam claras.
- Aumente a espessura dos caracteres em uma imagem.
- Desfoque imagens barulhentas enquanto preserva as bordas das letras.
- Endireite a inclinação da página e corrija a distorção da lente da câmera nas fotos da página.
APIs especializadas para vários tipos de documentos
Aspose.OCR para Python via Java oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com máxima precisão:
- Carteiras de identidade e passaportes digitalizados ou fotografados.
- Placas de veículos.
- Faturas.
- Recibos.
Verificador ortográfico integrado
Embora Aspose.OCR para Python via Java forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes fora do padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados de reconhecimento, você pode ativar o corretor ortográfico, que localiza e corrige automaticamente erros ortográficos com base no idioma de reconhecimento selecionado.
Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estejam presentes nos dicionários ortográficos comuns, você poderá fornecer suas próprias listas de palavras.
Reconhecimento Eficiente de Lote
Nossa API Python OCR permite que você agilize o reconhecimento de imagens. Utilize métodos versáteis de processamento em lote para processamento eficiente de múltiplas imagens em uma única chamada:
- Reconheça arquivos PDF e TIFF de várias páginas.
- Processe todos os arquivos dentro de uma pasta.
- Lidar com o reconhecimento de todos os arquivos em um arquivo.
- Reconhecer imagens de uma lista especificada.
Aprendendo por meio de exemplos de Python
Explore uma variedade de exemplos de Python projetados para ajudá-lo a compreender rapidamente as funções e os recursos de nossa solução de OCR. Obtenha rapidamente insights sobre como criar soluções personalizadas que atendam às suas necessidades comerciais específicas.
Recursos e capacidades
Aspose.OCR for Python via Java Explore os recursos avançados do Aspose.OCR para Python
OCR de fotos
Extraia texto de fotos de smartphones com precisão de digitalização.
PDF pesquisável
Converta qualquer digitalização em um documento totalmente pesquisável e indexável.
Reconhecimento de URL
Reconheça uma imagem do URL sem baixá-la localmente.
Reconhecimento em massa
Leia todas as imagens de documentos, pastas e arquivos de várias páginas.
Qualquer fonte e estilo
Identifique e reconheça texto em todos os tipos e estilos populares.
Reconhecimento de ajuste fino
Ajuste todos os parâmetros de OCR para obter melhores resultados de reconhecimento.
Corretor ortográfico
Melhore os resultados corrigindo automaticamente palavras com erros ortográficos.
Encontre texto em imagens
Pesquise texto ou expressão regular em um conjunto de imagens.
Compare textos de imagens
Compare textos em duas imagens, independentemente do caso e do layout.
Amostras de código Python
Descubra exemplos de código para integrar perfeitamente Aspose.OCR para Python via Java em seus aplicativos.
Instalação sem esforço
Como um pacote Python ou um arquivo para download com dependências mínimas, Aspose.OCR para Python via Java garante fácil distribuição. Integre-o ao seu projeto diretamente do Python e você estará preparado para aproveitar recursos completos de OCR, salvando resultados de reconhecimento em vários formatos.
Após a instalação, comece imediatamente a usar o Aspose.OCR para Python via Java, embora com certas limitações. Uma licença temporária remove todas as restrições da versão de teste por 30 dias. Utilize este período para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra do Aspose.OCR para Python via Java posteriormente.
Carregar licença
lic = License()
lic.set_license(self.licPath)
Reconhecimento de imagem
O principal desafio nas aplicações de OCR é a escassez de scanners para os usuários finais. Nossa API, perfeitamente integrada com Python via Java, apresenta filtros robustos de pré-processamento de imagens integrados que lidam com imagens giradas, distorcidas e com ruído. Combinado com o suporte para todos os formatos de imagem, permite um reconhecimento confiável, mesmo a partir de fotos de smartphones. A maior parte do pré-processamento e da correção de imagens são automatizados, exigindo sua intervenção apenas em casos desafiadores.
Aplicar correções automáticas de imagem - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Conversor Universal Python
Nossa API lê habilmente qualquer imagem de scanners, câmeras ou smartphones: documentos PDF, arquivos JPEG, PNG, TIFF, GIF, BMP. Suporte total para documentos PDF de várias páginas, imagens TIFF e DjVu garantem versatilidade. Você também pode fornecer uma imagem da web por meio de um URL.
Os resultados do reconhecimento são retornados em formatos populares de documentos e troca de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Reconheça PDF e salve resultados em vários formatos de saída - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Otimizando o uso de recursos
OCR oferece um algoritmo de reconhecimento especial para extrair conteúdo de imagens com texto esparso e fundos com ruído/coloridos. Este método melhora significativamente a precisão do OCR nos seguintes casos de negócios:
- Leia o texto das fotos de rua.
- Segmente e identifique sinais de trânsito e placas em imagens de ruas.
- Localize as etiquetas de preços e interprete o texto extraído como preços.
- Encontre e agregue regiões de interesse nos rótulos dos alimentos, como informações nutricionais ou listas de ingredientes.
- Identifique e analise placas de automóveis.
- Extraia texto de menus e catálogos.
OCR de área aberta - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extraindo texto de fotos de rua
OCR para Python oferece um algoritmo de reconhecimento especial que extrai texto de placas de veículos, incluindo fotos escuras e desfocadas. O texto resultante pode então ser salvo automaticamente no banco de dados ou verificado automaticamente.
Reconhecer o número do carro - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)