Por que Aspose.OCR para Python via Java?

Aspose.OCR para Python via Java integra perfeitamente recursos poderosos de reconhecimento óptico de caracteres (OCR) em seus notebooks e aplicativos Python de plataforma cruzada. Com nossa API intuitiva e de alta velocidade, você pode extrair facilmente texto de digitalizações, capturas de tela, links da web ou fotos de smartphones, fornecendo resultados prontos para consolidação, análise ou armazenamento. Reconheça imagens digitalizadas, fotos de smartphones, capturas de tela e PDFs digitalizados, salvando os resultados em formatos de documentos populares. Filtros avançados de pré-processamento lidam com imagens giradas, distorcidas e com ruído. Otimize o desempenho transferindo tarefas para a GPU.

Illustration ocr

OCR rápido e preciso

Obtenha resultados de OCR precisos e de alta velocidade com nossa avançada tecnologia Python via Java.

Suporte multilíngue

Reconheça texto em 28 idiomas, incluindo scripts latinos, cirílicos e chineses, garantindo versatilidade para seus aplicativos Python via Java.

Suporte flexível para imagens

Processe imagens de scanners, câmeras e smartphones perfeitamente com Python via Java.

Precisão no reconhecimento de caracteres chineses

Reconheça mais de 6.000 caracteres chineses com precisão em seus projetos Python via Java.

Preservar estilos e formatação de fontes

Mantenha estilos de fonte e formatação para representação precisa de texto reconhecido em seus aplicativos Python via Java.

Amostra de código ativo

Inicie o reconhecimento de texto de imagens em apenas três linhas de código. Experimente a simplicidade!

Pronto para reconhecer Pronto para reconhecer Solte um arquivo aqui ou clique para navegar *

* Ao enviar seus arquivos ou usar o serviço você concorda com nosso Termos de uso e política de Privacidade.

Resultado de reconhecimento
 

Converter imagem em texto

Mais exemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Compatibilidade de back-end Java

Projetada como um módulo Python, nossa biblioteca garante compatibilidade com os principais sistemas operacionais compatíveis com Java - incluindo Microsoft Windows, Linux e macOS, ou o plataformas de nuvem. Isso permite desenvolver aplicativos em uma plataforma e executá-los perfeitamente em outra, eliminando a necessidade de quaisquer modificações no código.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de arquivo suportados

Aspose.OCR for Python via Java pode trabalhar com praticamente qualquer arquivo você pode obter de um scanner ou câmera. Os resultados do reconhecimento são retornados nos formatos mais populares de arquivos e troca de dados que podem ser salvos, importados para um banco de dados ou analisados ​​em tempo real.

Imagens

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR em lote

  • Multi-page PDF
  • ZIP
  • Folder

Resultados de reconhecimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalação fácil para Python via Java

Aspose.OCR para Python via Java é entregue como um pacote Python ou como um arquivo para download com dependências mínimas. Instale facilmente em seu projeto e você estará pronto para reconhecer textos em vários idiomas suportados e salvar resultados de reconhecimento em vários formatos.

Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional e sem limitações.

OCR poderoso para aplicativos Python

Nossa biblioteca se integra facilmente, permitindo que aplicativos Python sejam executados perfeitamente em qualquer plataforma – desktop Windows, Windows Server, macOS, Linux e nuvem.

28 idiomas de reconhecimento

Nossa API Python e Java OCR reconhece uma infinidade de linguagens e scripts de escrita populares, incluindo linguagens mistas:

Deixe a detecção de idioma para a biblioteca ou defina você mesmo o idioma para melhorar o desempenho e a confiabilidade do reconhecimento.

  • Alfabeto latino estendido: croata, tcheco, dinamarquês, holandês, inglês, estoniano, finlandês, francês, alemão, italiano, letão, lituano, norueguês, polonês, português, romeno, eslovaco, esloveno, espanhol, sueco;
  • Alfabeto Cirílico: Bielorrusso, Búlgaro, Cazaque, Russo, Sérvio, Ucraniano;
  • Chinês: Mais de 6.000 caracteres;
  • Hindi.

Filtros aprimorados de processamento de imagem

A precisão do reconhecimento óptico de caracteres depende muito da qualidade da imagem original. Aspose.OCR para Python via Java oferece uma ampla variedade de filtros de processamento de imagem automatizados e manuais para otimizar uma imagem antes do envio ao mecanismo de OCR:

  • Endireite automaticamente imagens ligeiramente inclinadas.
  • Corrija manualmente a rotação de imagens muito distorcidas.
  • Remova automaticamente sujeira, manchas, arranhões, brilho, gradientes indesejados e outros tipos de ruído.
  • Ajusta automaticamente o contraste da imagem.
  • Aumente automaticamente ou redimensione manualmente a imagem.
  • Converta imagens em preto e branco ou em tons de cinza.
  • Inverta as cores da imagem, fazendo com que as áreas claras pareçam escuras e as áreas escuras pareçam claras.
  • Aumente a espessura dos caracteres em uma imagem.
  • Desfoque imagens barulhentas enquanto preserva as bordas das letras.
  • Endireite a inclinação da página e corrija a distorção da lente da câmera nas fotos da página.

APIs especializadas para vários tipos de documentos

Aspose.OCR para Python via Java oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com máxima precisão:

  • Carteiras de identidade e passaportes digitalizados ou fotografados.
  • Placas de veículos.
  • Faturas.
  • Recibos.

Verificador ortográfico integrado

Embora Aspose.OCR para Python via Java forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes fora do padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados de reconhecimento, você pode ativar o corretor ortográfico, que localiza e corrige automaticamente erros ortográficos com base no idioma de reconhecimento selecionado.

Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estejam presentes nos dicionários ortográficos comuns, você poderá fornecer suas próprias listas de palavras.

Reconhecimento Eficiente de Lote

Nossa API Python OCR permite que você agilize o reconhecimento de imagens. Utilize métodos versáteis de processamento em lote para processamento eficiente de múltiplas imagens em uma única chamada:

  • Reconheça arquivos PDF e TIFF de várias páginas.
  • Processe todos os arquivos dentro de uma pasta.
  • Lidar com o reconhecimento de todos os arquivos em um arquivo.
  • Reconhecer imagens de uma lista especificada.

Aprendendo por meio de exemplos de Python

Explore uma variedade de exemplos de Python projetados para ajudar você a compreender rapidamente as funções e os recursos de nossa solução de OCR. Obtenha rapidamente insights sobre como criar soluções personalizadas que atendam às suas necessidades comerciais específicas.

Recursos e capacidades

Aspose.OCR for Python via Java Explore os recursos avançados do Aspose.OCR para Python

Feature icon

OCR de fotos

Extraia texto de fotos de smartphones com precisão de digitalização.

Feature icon

PDF pesquisável

Converta qualquer digitalização em um documento totalmente pesquisável e indexável.

Feature icon

Reconhecimento de URL

Reconheça uma imagem do URL sem baixá-la localmente.

Feature icon

Reconhecimento em massa

Leia todas as imagens de documentos, pastas e arquivos de várias páginas.

Feature icon

Qualquer fonte e estilo

Identifique e reconheça texto em todos os tipos e estilos populares.

Feature icon

Reconhecimento de ajuste fino

Ajuste todos os parâmetros de OCR para obter melhores resultados de reconhecimento.

Feature icon

Verificador ortográfico

Melhore os resultados corrigindo automaticamente palavras com erros ortográficos.

Feature icon

Encontre texto em imagens

Pesquise texto ou expressão regular em um conjunto de imagens.

Feature icon

Compare textos de imagens

Compare textos em duas imagens, independentemente do caso e do layout.

Amostras de código Python

Descubra exemplos de código para integrar perfeitamente Aspose.OCR para Python via Java em seus aplicativos.

Instalação sem esforço

Como um pacote Python ou um arquivo para download com dependências mínimas, Aspose.OCR para Python via Java garante fácil distribuição. Integre-o ao seu projeto diretamente do Python e você estará preparado para aproveitar recursos completos de OCR, salvando resultados de reconhecimento em vários formatos.

Após a instalação, comece imediatamente a usar o Aspose.OCR para Python via Java, embora com certas limitações. Uma licença temporária remove todas as restrições da versão de teste por 30 dias. Utilize este período para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra do Aspose.OCR para Python via Java posteriormente.

Carregar licença

lic = License()
lic.set_license(self.licPath)

Reconhecimento de imagem

O principal desafio nas aplicações de OCR é a escassez de scanners para os usuários finais. Nossa API, perfeitamente integrada com Python via Java, apresenta filtros robustos de pré-processamento de imagens integrados que lidam com imagens giradas, distorcidas e com ruído. Combinado com o suporte para todos os formatos de imagem, permite um reconhecimento confiável, mesmo a partir de fotos de smartphones. A maior parte do pré-processamento e da correção de imagens são automatizados, exigindo sua intervenção apenas em casos desafiadores.

Aplicar correções automáticas de imagem - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Conversor Universal Python

Nossa API lê habilmente qualquer imagem de scanners, câmeras ou smartphones: documentos PDF, arquivos JPEG, PNG, TIFF, GIF, BMP. Suporte total para documentos PDF de várias páginas, imagens TIFF e DjVu garantem versatilidade. Você também pode fornecer uma imagem da web por meio de um URL.

Os resultados do reconhecimento são retornados em formatos populares de documentos e troca de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Reconheça PDF e salve resultados em vários formatos de saída - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Otimizando o uso de recursos

OCR oferece um algoritmo de reconhecimento especial para extrair conteúdo de imagens com texto esparso e fundos com ruído/coloridos. Este método melhora significativamente a precisão do OCR nos seguintes casos de negócios:

  • Leia o texto das fotos de rua.
  • Segmente e identifique sinais de trânsito e placas em imagens de ruas.
  • Localize as etiquetas de preços e interprete o texto extraído como preços.
  • Encontre e agregue regiões de interesse nos rótulos dos alimentos, como informações nutricionais ou listas de ingredientes.
  • Identifique e analise placas de automóveis.
  • Extraia texto de menus e catálogos.

OCR de área aberta - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraindo texto de fotos de rua

OCR para Python oferece um algoritmo de reconhecimento especial que extrai texto de placas de veículos, incluindo fotos escuras e desfocadas. O texto resultante pode então ser salvo automaticamente no banco de dados ou verificado automaticamente.

Reconhecer o número do carro - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)