Por que asppor.ocr for Python via Java?

Aspose.ocr for python via java integra perfeitamente os poderosos recursos de reconhecimento de caracteres ópticos (OCR) nos seus notebooks e aplicativos de plataforma cruzada. Com nossa API intuitiva e de alta velocidade, você pode extrair texto sem esforço de digitalizações, capturas de tela, links da Web ou fotos de smartphones, fornecendo resultados prontos para consolidação, análise ou armazenamento. Reconheça imagens digitalizadas, fotos de smartphones, capturas de tela e PDFs digitalizados, economizando resultados em formatos de documentos populares. Os filtros avançados de pré-processamento de imagens rotacionadas, distorcidas e barulhentas. Otimize o desempenho descarregando tarefas para a GPU.

Illustration ocr

OCR rápido e preciso

A obtenção de resultados de OCR de alta velocidade e precisão com nosso Python avançado via tecnologia Java.

Suporte multilíngue

Reconheça o texto em mais de 140 idiomas, incluindo scripts latinos, cirílicos, árabes, persas, indic e chineses, garantindo versatilidade para suas aplicações Python via Java.

Suporte de imagem flexível

Processar imagens de scanners, câmeras e smartphones perfeitamente com Python via Java.

Precisão no reconhecimento de caracteres chinês

Reconheça mais de 6.000 caracteres chineses com precisão em seus projetos Python via Java.

Preservar estilos de fonte e formatação

Mantenha os estilos de fonte e a formatação para uma representação precisa do texto reconhecido em seus aplicativos Python via Java.

Amostra de código vivo

Inicie o reconhecimento de texto a partir de imagens em apenas três linhas de código. Experimente a simplicidade!

Pronto para reconhecer Pronto para reconhecer Solte um arquivo aqui ou clique para navegar *

* Enviando seus arquivos ou usando o serviço com o qual você concorda com o nosso Termos de uso e política de Privacidade.

Resultado de reconhecimento
 

Converter imagem em texto

Mais exemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Escolha sua preferência

Escolha a biblioteca certa para suas necessidades. Explore as APIs disponíveis e seus recursos para selecionar a solução mais eficiente.

Versatilidade

Python via .NET

Desenvolvimento fácil, legibilidade e manutenção do código
Possui mais recursos e recebe as atualizações mais frequentes
A velocidade geral pode ser um pouco mais lenta que outras plataformas

Uniformidade

Python via Java

Use a mesma biblioteca em qualquer plataforma
Execute perfeitamente seu aplicativo em qualquer dispositivo
Requer o Java Runtime Environment (JRE) versão 8 ou mais tarde

Desempenho

Python via C++

A velocidade mais rápida possível, independentemente da plataforma
Uma grande quantidade de controle sobre o gerenciamento de recursos
Direcionado a desenvolvedores experientes

Java Compatibilidade de back -end

Projetado como um módulo Python, nossa biblioteca garante a compatibilidade entre os principais sistemas operacionais que suportam java - incluindo Microsoft Windows, Linux e MacOS ou as plataformas de nuvem. Isso permite desenvolver aplicativos em uma plataforma e executá -los perfeitamente em outro, eliminando a necessidade de quaisquer modificações de código.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de arquivo suportados

Aspose.OCR for Python via Java pode trabalhar com qualquer arquivo Você pode ir de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados em tempo real.

Imagens

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Lote ocr

  • Multi-page PDF
  • ZIP
  • Folder

Resultados de reconhecimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalação sem esforço para Python via Java

Aspose.ocr for python via java é entregue como um pacote python ou como um arquivo para download com dependências mínimas. Facilmente Install em seu projeto, e você está pronto para reconhecer textos em vários idiomas suportados e salvar resultados de reconhecimento em vários formatos.

Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional sem limitações.

OCR poderoso para aplicações Python

Nossa biblioteca se integra facilmente, permitindo que os aplicativos Python funcionem perfeitamente em qualquer plataforma - Windows de desktop, servidor Windows, MacOS, Linux e a nuvem.

140+ idiomas de reconhecimento

Nossa API Python e Java OCR reconhece uma infinidade de idiomas e scripts de redação popular, incluindo idiomas mistos:

Deixe a detecção de linguagem na biblioteca ou defina o idioma para obter um desempenho e confiabilidade aprimorados de reconhecimento.

  • ** Latim estendido ** alfabeto: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
  • ** Cirílico ** alfabeto: russo, ucraniano, cazaque, sérvio, Bielorrússia, búlgaro;
  • Árabe, persa, urdu;
  • Script chinês e devanagari, incluindo hindi, marathi, bhojpuri e outros.

Filtros aprimorados de processamento de imagem

A precisão do reconhecimento óptico de caracteres depende muito da qualidade da imagem original. Aspose.ocr for Python via Java oferece uma ampla variedade de filtros de processamento de imagens automatizados e manuais para otimizar uma imagem antes de enviar ao mecanismo OCR:

  • Endireitar automaticamente imagens ligeiramente inclinadas.
  • Corrija manualmente a rotação de imagens severamente distorcidas.
  • Remova automaticamente sujeira, manchas, arranhões, brilho, gradientes indesejados e outros tipos de ruído.
  • Ajuste automaticamente o contraste da imagem.
  • Reduzir a imagem automaticamente de luxo ou manualmente.
  • Converta imagens em preto e branco ou em escala de cinza.
  • As cores invertidas da imagem, fazendo com que as áreas claras pareçam as áreas escuras e escuras pareçam claras.
  • Aumente a espessura dos caracteres em uma imagem.
  • Imagens desfocadas e ruidosas ao preservar as bordas das letras.
  • Endurecer a inclinação da página e a distorção correta da lente da câmera nas fotos da página.

APIs especilizadas para vários tipos de documentos

Aspose.ocr for python via java oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com precisão máxima:

  • Digitalizar ou fotografar cartões de identificação e passaportes.
  • Placas de veículos.
  • Faturas.
  • Recibos.

Verificador ortográfico embutido

Embora Aspose.ocr for Python via Java forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes não padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados do reconhecimento, você pode ativar o verificador ortográfico, que encontra e corrige automaticamente os erros de ortografia com base no idioma de reconhecimento selecionado.

Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estão presentes nos dicionários de ortografia comuns, você poderá fornecer suas próprias listas de palavras.

Reconhecimento eficiente em lote

Our Python OCR API empowers you to streamline image recognition. Utilize métodos versáteis de processamento de lote para processamento eficiente de várias imagens em uma única chamada:

  • Reconheça os arquivos PDF de várias páginas, TIFF.
  • Processe todos os arquivos em uma pasta.
  • Lidar com o reconhecimento de todos os arquivos em um arquivo.
  • Reconhecer imagens de uma lista especificada.

Aprendendo através de exemplos de Python

Explore uma variedade de exemplos de python projetados para ajudá-lo a entender rapidamente as funções e recursos de nossa solução OCR. Quickly gain insight into creating customized solutions that meet your specific business requirements.

Recursos e recursos

Aspose.OCR for Python via Java Explore as características avançadas do Aspose.ocr for Python

Feature icon

Foto OCR

Extraia o texto das fotos de smartphones com precisão no nível da verificação.

Feature icon

PDF pesquisável

Converta qualquer varredura em um documento totalmente pesquisável e indexável.

Feature icon

Reconhecimento de URL

Reconheça uma imagem do URL sem baixá -la localmente.

Feature icon

Reconhecimento em massa

Leia todas as imagens de documentos, pastas e arquivos de várias páginas.

Feature icon

Qualquer fonte e estilo

Identifique e reconheça o texto em todos os tipos e estilos populares.

Feature icon

Reconhecimento fino

Ajuste todos os parâmetros OCR para obter os melhores resultados de reconhecimento.

Feature icon

Verificador ortográfico

Melhorar os resultados corrigindo automaticamente as palavras incorretas.

Feature icon

Encontre texto em imagens

Procure texto ou expressão regular dentro de um conjunto de imagens.

Feature icon

Compare textos de imagem

Compare textos em duas imagens, independentemente do caso e do layout.

Amostras de código Python

Descubra amostras de código para integrar perfeitamente aspose.ocr for python via java em seus aplicativos.

Instalação sem esforço

Como um pacote python ou um arquivo para download com dependências mínimas, Aspose.ocr for Python via Java garante distribuição fácil. Integrore-o ao seu projeto diretamente do Python e você está preparado para aproveitar os recursos completos do OCR, economizando resultados de reconhecimento em vários formatos. Uma licença temporária remove todas as restrições da versão de avaliação por 30 dias. Utilize esse período para iniciar o desenvolvimento de um aplicativo de OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra de Aspose.ocr for Python via Java posteriormente.

Carregar licença

lic = License()
lic.set_license(self.licPath)

Reconhecimento de imagem

O principal desafio nos aplicativos OCR é a escassez de scanners para usuários finais. Nossa API, perfeitamente integrada ao Python via Java, apresenta robustos filtros de pré-processamento de imagem robustos que manuseiam imagens giradas, distorcidas e barulhentas. Combinado com o suporte para todos os formatos de imagem, ele permite um reconhecimento confiável, mesmo nas fotos de smartphones. A maioria dos pré-processamento e correção da imagem é automatizada, exigindo sua intervenção apenas em casos desafiadores.

Aplicar correções automáticas de imagem - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Conversor universal python

Nossa API lê adepto qualquer imagem de scanners, câmeras ou smartphones: documentos em PDF, JPEG, PNG, TIFF, GIF, arquivos BMP. Suporte total para documentos em PDF de várias páginas, TIFF e imagens DJVU garante a versatilidade. Você também pode fornecer uma imagem da Web por meio de um URL. Os resultados de reconhecimento

são retornados nos formatos populares de documentos e trocas de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Reconheça o PDF e salve resultados em vários formatos de saída - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Otimizando o uso de recursos

O OCR oferece um algoritmo de reconhecimento especial para extrair conteúdo de imagens com texto esparso e fundo barulhento/colorido. Este método melhora significativamente a precisão do OCR nos seguintes casos de negócios:

  • Leia o texto das fotos da rua.
  • Segmentar e identificar sinais de trânsito e placas nas imagens da rua.
  • Localize as tags de preço e interprete o texto extraído como preços.
  • Encontre e agregados regiões de interesse nas etiquetas de alimentos, como informações nutricionais ou listas de ingredientes.
  • Identifique e analise as placas de carros.
  • Extraia o texto de menus e catálogos.

Área aberta OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraindo texto das fotos de rua

O OCR for Python oferece um algoritmo de reconhecimento especial que extrai texto de placas de veículos, incluindo fotos escuras e embaçadas. O texto resultante pode ser salvo automaticamente no banco de dados ou verificado automaticamente.

Reconhecer o número do carro - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)