Por que asppos.ocr for python via .net?

Embarque em uma jornada com o Aspose OCR para Python via .net-uma API OCR versátil e fácil de usar. Incorporar a funcionalidade OCR em seus aplicativos Python com menos de 5 linhas de código, eliminando a necessidade de redes de matemática ou neurais complexas. Nosso poderoso motor OCR oferece velocidade e precisão incomparáveis, apoiando mais de 140 idiomas, incluindo inglês, cirílico, árabe, persa, hindi, chinês, japonês, coreano, tâmil e muito mais. Seja imagens digitalizadas, fotos de smartphones, capturas de tela ou PDFs digitalizados, obtenha resultados em formatos populares de documentos e troca de dados. Aproveite os filtros de pré-processamento para lidar com imagens rotadas, distorcidas e barulhentas.

Illustration ocr

OCR eficiente e preciso

Experimente a velocidade e a precisão incomparáveis nos resultados de OCR com a tecnologia avançada de Python.

Multilíngue

Reconheça o texto em mais de 140 idiomas: inglês, francês, alemão, espanhol, russo, chinês, hindi, japonês, coreano, tâmil, árabe, persa e muito mais.

Universal

Processe imagens sem esforço de diversas fontes - scanners, câmeras e smartphones - usando o Python.

Idiomas asiáticos

Obtenha um reconhecimento preciso dos roteiros chineses, árabes, devanagari e dravidianos, bem como textos de linguagem mista.

Preservar o layout

Mantenha a formatação da fonte para uma representação precisa do texto e reconheça as tabelas.

Amostra de código vivo

Converta uma imagem em texto em apenas três linhas de código Python. Experimente você mesmo!

Pronto para reconhecer Pronto para reconhecer Solte um arquivo aqui ou clique para navegar *

* Enviando seus arquivos ou usando o serviço com o qual você concorda com o nosso Termos de uso e política de Privacidade.

Resultado de reconhecimento
 

Converter imagem em texto

Descubra mais exemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Escolha sua preferência

Escolha a biblioteca certa para suas necessidades. Explore as APIs disponíveis e seus recursos para selecionar a solução mais eficiente.

Versatilidade

Python via .NET

Desenvolvimento fácil, legibilidade e manutenção do código
Possui mais recursos e recebe as atualizações mais frequentes
A velocidade geral pode ser um pouco mais lenta que outras plataformas

Uniformidade

Python via Java

Use a mesma biblioteca em qualquer plataforma
Execute perfeitamente seu aplicativo em qualquer dispositivo
Requer o Java Runtime Environment (JRE) versão 8 ou mais tarde

Desempenho

Python via C++

A velocidade mais rápida possível, independentemente da plataforma
Uma grande quantidade de controle sobre o gerenciamento de recursos
Direcionado a desenvolvedores experientes

Corre por toda parte

Independentemente do nome, Aspose.ocr for Python via .NET não exige que o .NET seja instalado na plataforma de destino. O pacote de instalação já vem com todos os componentes necessários e pode operar perfeitamente em qualquer plataforma - seja uma máquina local, servidor da web ou nuvem.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de arquivo suportados

Aspose.OCR for Python via .NET pode trabalhar com qualquer arquivo Você pode ir de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados em tempo real.

Imagens

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Lote ocr

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Resultados de reconhecimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalação

Aspose.ocr for python via .NET é entregue como um pacote Python com dependências mínimas ou como um arquivo para download ou pacote Pypi . Facilmente install em seu projeto, e você está pronto para reconhecer textos em mais de 140 idiomas e salvar resultados de reconhecimento em vários formatos.

Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional sem limitações.

OCR sob Python

Nossa biblioteca se integra facilmente, permitindo que os aplicativos Python funcionem perfeitamente em qualquer plataforma - Windows de desktop, servidor Windows, MacOS, Linux e a nuvem.

140+ idiomas de reconhecimento

Nossa biblioteca Java OCR é uma solução universal para processamento de documentos, extração de dados e digitalização de conteúdo em escala global. Com apoio a uma vasta gama de scripts europeus, do Oriente Médio e Asiático, é bem adaptado para qualquer país e negócio.

ASPO OCR para Java reconhece texto em documentos multilíngues, como chinês/inglês, árabe/francês ou cirílico/inglês. Os seguintes idiomas são suportados:

  • ** Latim estendido **: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
  • ** Cirílico ** alfabeto: russo, ucraniano, cazaque, búlgaro, incluindo textos cirílicos/ingleses mistos;
  • Árabe, persa, urdu, incluindo textos misturados com inglês;
  • Línguas chinesas, coreanas, japonesas, devanagari e dravidianas, incluindo hindi, tâmil, marathi e outros. Os textos de linguagem mista também são suportados.

Filtros de processamento poderosos

A precisão e a confiabilidade do reconhecimento de caracteres ópticas são altamente dependentes da qualidade da imagem original. ASPO OCR for Python via .Net oferece um grande número de filtros de processamento de imagens totalmente automatizados e manuais que aprimoram uma imagem antes de ser enviada ao mecanismo OCR:

  • Gire automaticamente as imagens de cabeça para baixo e giro.
  • Detecte imagens invertidas e extraia o texto branco sobre preto.
  • Remova automaticamente a sujeira, manchas, arranhões, brilho, gradientes indesejados e outro ruído.
  • Ajuste automaticamente o contraste da imagem.
  • Upscale automaticamente ou redimensione manualmente a imagem.
  • Converta imagens em preto e branco ou em escala de cinza.
  • Encontre áreas potencialmente problemáticas de imagem e retorne as informações sobre o tipo de defeito e suas coordenadas.
  • Aumente a espessura dos caracteres em uma imagem.
  • Imagens desfocadas e barulhentas enquanto preservam as bordas das letras.
  • Endireitar a curvatura da página e consertar a distorção da lente da câmera para fotos de página.

Otimizado para tipos de documentos específicos

ASPO OCR for Python via .Net oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com precisão máxima:

Verificador ortográfico embutido

Embora nossa biblioteca Python OCR forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes fora do padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados do reconhecimento, você pode ativar o verificador ortográfico, que encontra e corrige automaticamente os erros de ortografia com base no idioma de reconhecimento selecionado.

Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estão presentes nos dicionários de ortografia comuns, você poderá fornecer suas próprias listas de palavras.

Reconhecimento em lote

Nossa API do Python OCR liberta você de reconhecer imagens uma a uma. Empregue vários métodos de processamento de lote para reconhecer várias imagens em uma chamada:

  • Reconhecimento de arquivos PDF, TIFF e DJVU de várias páginas.
  • Reconhecimento de todos os arquivos em uma pasta.
  • Reconhecimento de todos os arquivos em um arquivo.
  • Reconhecimento de todos os arquivos de uma lista.

Aprendizado por amostra

O OCR for Python fornece uma variedade de exemplos escritos em python, permitindo que você se familiarize rapidamente com suas funções e capacidades. Obtenha informações para criar soluções personalizadas para atender às suas necessidades de negócios em Python.

Recursos e recursos

Aspose.OCR for Python via .NET Aspose.ocr for python via .net resolve suas tarefas rapidamente e fácil.

Feature icon

Foto OCR

Extraia o texto das fotos de smartphones com precisão no nível da verificação.

Feature icon

PDF pesquisável

Converta qualquer varredura em um documento totalmente pesquisável, indexável e editável.

Feature icon

Reconhecimento de URL

Reconheça uma imagem do URL sem baixá -la localmente.

Feature icon

Reconhecimento em massa

Leia todas as imagens de documentos, pastas e arquivos de várias páginas.

Feature icon

Qualquer fonte e estilo

Identifique e reconheça o texto em todos os tipos e estilos populares.

Feature icon

Reconhecimento fino

Ajuste todos os parâmetros OCR para obter os melhores resultados de reconhecimento.

Feature icon

Verificador ortográfico

Melhorar os resultados corrigindo automaticamente as palavras incorretas.

Feature icon

Encontre texto em imagens

Procure texto ou expressão regular dentro de um conjunto de imagens.

Feature icon

Compare textos de imagem

Compare textos em duas imagens, independentemente do caso e do layout.

Amostras de código Python

Desenhe -se em amostras de código para integrar perfeitamente o OCR em seus aplicativos Python.

Instalação

Distribuído como uma roda python ou um pacote para download independente, Aspose.ocr for Python via .Net é facilmente distribuído. A integração no seu projeto Python, diretamente do seu ambiente de desenvolvimento integrado Python preferido (IDE), é um processo contínuo. Basta instalá-lo e você está preparado para aproveitar a gama completa de recursos de OCR, economizando resultados de reconhecimento em vários formatos. Uma licença temporária levanta todas as restrições da versão do teste por 30 dias. Utilize esse período para iniciar o desenvolvimento de um aplicativo de OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra de Aspose.ocr for Python via .Net posteriormente.

Carregar licença

lic = License()
lic.set_license(self.licPath)

Reconhecer o texto em fotos

Ler o texto de qualquer conteúdo no Aspose OCR for Python é tão fácil quanto chamar um método de reconhecimento universal.

Converter foto em texto - python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Conversor universal python

Nossa API lê adepto qualquer imagem de scanners, câmeras ou smartphones: documentos em PDF, jpeg, png, tiff, gif, imagens BMP e até arquivos DJVU. Suporte total para documentos em PDF de várias páginas, TIFF e imagens DJVU garante a versatilidade. Você também pode fornecer uma imagem da Web por meio de um URL. Os resultados de reconhecimento

são retornados nos formatos populares de documentos e trocas de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Reconheça o PDF e salve resultados em vários formatos de saída - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Otimização de recursos em Python

O reconhecimento óptico de caráter exige recursos. Nossa API oferece maneiras flexíveis de equilibrar a tríade de qualidade do preço do tempo clássico:

  • Escolha entre reconhecimento completo e rápido reconhecimento.
  • Especifique o número de threads alocados para reconhecimento ou permita que a biblioteca seja dimensionada automaticamente para o número de núcleos do processador.
  • Liberte a CPU descarregando os cálculos para o back -end .NET.

Reconhecimento rápido - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconhecer uma única linha

Se sua imagem já estiver aparada para uma única linha de texto, ela poderá ser reconhecida no modo mais rápido possível, sem correções automatizadas, detecção da estrutura de conteúdo e outras etapas que consomem recursos. Ele pode acelerar o OCR até 7 vezes mais rápido que o processo de reconhecimento normal.

Reconhecer uma única linha de texto na imagem - python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)