Biblioteca Python OCR
Converter imagens em texto com python OCR
Mais exibições ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Por que asppos.ocr for python via .net?
Embarque em uma jornada com o Aspose OCR para Python via .net-uma API OCR versátil e fácil de usar. Incorporar a funcionalidade OCR em seus aplicativos Python com menos de 5 linhas de código, eliminando a necessidade de redes de matemática ou neurais complexas. Nosso poderoso motor OCR oferece velocidade e precisão incomparáveis, apoiando mais de 140 idiomas, incluindo inglês, cirílico, árabe, persa, hindi, chinês, japonês, coreano, tâmil e muito mais. Seja imagens digitalizadas, fotos de smartphones, capturas de tela ou PDFs digitalizados, obtenha resultados em formatos populares de documentos e troca de dados. Aproveite os filtros de pré-processamento para lidar com imagens rotadas, distorcidas e barulhentas.

OCR eficiente e preciso
Experimente a velocidade e a precisão incomparáveis nos resultados de OCR com a tecnologia avançada de Python.
Multilíngue
Reconheça o texto em mais de 140 idiomas: inglês, francês, alemão, espanhol, russo, chinês, hindi, japonês, coreano, tâmil, árabe, persa e muito mais.
Universal
Processe imagens sem esforço de diversas fontes - scanners, câmeras e smartphones - usando o Python.
Idiomas asiáticos
Obtenha um reconhecimento preciso dos roteiros chineses, árabes, devanagari e dravidianos, bem como textos de linguagem mista.
Preservar o layout
Mantenha a formatação da fonte para uma representação precisa do texto e reconheça as tabelas.
Amostra de código vivo
Converta uma imagem em texto em apenas três linhas de código Python. Experimente você mesmo!
* Enviando seus arquivos ou usando o serviço com o qual você concorda com o nosso Termos de uso e política de Privacidade.
Converter imagem em texto
Descubra mais exemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Escolha sua preferência
Escolha a biblioteca certa para suas necessidades. Explore as APIs disponíveis e seus recursos para selecionar a solução mais eficiente.
Versatilidade
Python via .NET
Uniformidade
Python via Java
Desempenho
Python via C++
Corre por toda parte
Independentemente do nome, Aspose.ocr for Python via .NET não exige que o .NET seja instalado na plataforma de destino. O pacote de instalação já vem com todos os componentes necessários e pode operar perfeitamente em qualquer plataforma - seja uma máquina local, servidor da web ou nuvem.
Formatos de arquivo suportados
Aspose.OCR for Python via .NET pode trabalhar com qualquer arquivo Você pode ir de um scanner ou câmera. Os resultados do reconhecimento podem ser salvos, importados para um banco de dados ou analisados em tempo real.
Imagens
- JPEG
- PNG
- TIFF
- BMP
- GIF
Lote ocr
- Multi-page PDF
- DjVu
- ZIP
- Folder
Resultados de reconhecimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalação
Aspose.ocr for python via .NET é entregue como um pacote Python com dependências mínimas ou como um arquivo para download ou pacote Pypi . Facilmente install em seu projeto, e você está pronto para reconhecer textos em mais de 140 idiomas e salvar resultados de reconhecimento em vários formatos.
Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional sem limitações.
OCR sob Python
Nossa biblioteca se integra facilmente, permitindo que os aplicativos Python funcionem perfeitamente em qualquer plataforma - Windows de desktop, servidor Windows, MacOS, Linux e a nuvem.
140+ idiomas de reconhecimento
Nossa biblioteca Java OCR é uma solução universal para processamento de documentos, extração de dados e digitalização de conteúdo em escala global. Com apoio a uma vasta gama de scripts europeus, do Oriente Médio e Asiático, é bem adaptado para qualquer país e negócio.
ASPO OCR para Java reconhece texto em documentos multilíngues, como chinês/inglês, árabe/francês ou cirílico/inglês. Os seguintes idiomas são suportados:
- ** Latim estendido **: inglês, espanhol, francês, indonésio, português, alemão, vietnamita, turco, italiano, polonês e mais de 80;
- ** Cirílico ** alfabeto: russo, ucraniano, cazaque, búlgaro, incluindo textos cirílicos/ingleses mistos;
- Árabe, persa, urdu, incluindo textos misturados com inglês;
- Línguas chinesas, coreanas, japonesas, devanagari e dravidianas, incluindo hindi, tâmil, marathi e outros. Os textos de linguagem mista também são suportados.
Filtros de processamento poderosos
A precisão e a confiabilidade do reconhecimento de caracteres ópticas são altamente dependentes da qualidade da imagem original. ASPO OCR for Python via .Net oferece um grande número de filtros de processamento de imagens totalmente automatizados e manuais que aprimoram uma imagem antes de ser enviada ao mecanismo OCR:
- Gire automaticamente as imagens de cabeça para baixo e giro.
- Detecte imagens invertidas e extraia o texto branco sobre preto.
- Remova automaticamente a sujeira, manchas, arranhões, brilho, gradientes indesejados e outro ruído.
- Ajuste automaticamente o contraste da imagem.
- Upscale automaticamente ou redimensione manualmente a imagem.
- Converta imagens em preto e branco ou em escala de cinza.
- Encontre áreas potencialmente problemáticas de imagem e retorne as informações sobre o tipo de defeito e suas coordenadas.
- Aumente a espessura dos caracteres em uma imagem.
- Imagens desfocadas e barulhentas enquanto preservam as bordas das letras.
- Endireitar a curvatura da página e consertar a distorção da lente da câmera para fotos de página.
Otimizado para tipos de documentos específicos
ASPO OCR for Python via .Net oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com precisão máxima:
Verificador ortográfico embutido
Embora nossa biblioteca Python OCR forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes fora do padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados do reconhecimento, você pode ativar o verificador ortográfico, que encontra e corrige automaticamente os erros de ortografia com base no idioma de reconhecimento selecionado.
Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estão presentes nos dicionários de ortografia comuns, você poderá fornecer suas próprias listas de palavras.
Reconhecimento em lote
Nossa API do Python OCR liberta você de reconhecer imagens uma a uma. Empregue vários métodos de processamento de lote para reconhecer várias imagens em uma chamada:
- Reconhecimento de arquivos PDF, TIFF e DJVU de várias páginas.
- Reconhecimento de todos os arquivos em uma pasta.
- Reconhecimento de todos os arquivos em um arquivo.
- Reconhecimento de todos os arquivos de uma lista.
Aprendizado por amostra
O OCR for Python fornece uma variedade de exemplos escritos em python, permitindo que você se familiarize rapidamente com suas funções e capacidades. Obtenha informações para criar soluções personalizadas para atender às suas necessidades de negócios em Python.
Recursos e recursos
Aspose.OCR for Python via .NET Aspose.ocr for python via .net resolve suas tarefas rapidamente e fácil.
Foto OCR
Extraia o texto das fotos de smartphones com precisão no nível da verificação.
PDF pesquisável
Converta qualquer varredura em um documento totalmente pesquisável, indexável e editável.
Reconhecimento de URL
Reconheça uma imagem do URL sem baixá -la localmente.
Reconhecimento em massa
Leia todas as imagens de documentos, pastas e arquivos de várias páginas.
Qualquer fonte e estilo
Identifique e reconheça o texto em todos os tipos e estilos populares.
Reconhecimento fino
Ajuste todos os parâmetros OCR para obter os melhores resultados de reconhecimento.
Verificador ortográfico
Melhorar os resultados corrigindo automaticamente as palavras incorretas.
Encontre texto em imagens
Procure texto ou expressão regular dentro de um conjunto de imagens.
Compare textos de imagem
Compare textos em duas imagens, independentemente do caso e do layout.
Amostras de código Python
Desenhe -se em amostras de código para integrar perfeitamente o OCR em seus aplicativos Python.
Instalação
Distribuído como uma roda python ou um pacote para download independente, Aspose.ocr for Python via .Net é facilmente distribuído. A integração no seu projeto Python, diretamente do seu ambiente de desenvolvimento integrado Python preferido (IDE), é um processo contínuo. Basta instalá-lo e você está preparado para aproveitar a gama completa de recursos de OCR, economizando resultados de reconhecimento em vários formatos. Uma licença temporária levanta todas as restrições da versão do teste por 30 dias. Utilize esse período para iniciar o desenvolvimento de um aplicativo de OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra de Aspose.ocr for Python via .Net posteriormente.
Carregar licença
lic = License()
lic.set_license(self.licPath)
Reconhecer o texto em fotos
Ler o texto de qualquer conteúdo no Aspose OCR for Python é tão fácil quanto chamar um método de reconhecimento universal.
Converter foto em texto - python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Conversor universal python
Nossa API lê adepto qualquer imagem de scanners, câmeras ou smartphones: documentos em PDF, jpeg, png, tiff, gif, imagens BMP e até arquivos DJVU. Suporte total para documentos em PDF de várias páginas, TIFF e imagens DJVU garante a versatilidade. Você também pode fornecer uma imagem da Web por meio de um URL.
Os resultados de reconhecimento
são retornados nos formatos populares de documentos e trocas de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Reconheça o PDF e salve resultados em vários formatos de saída - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Otimização de recursos em Python
O reconhecimento óptico de caráter exige recursos. Nossa API oferece maneiras flexíveis de equilibrar a tríade de qualidade do preço do tempo clássico:
- Escolha entre reconhecimento completo e rápido reconhecimento.
- Especifique o número de threads alocados para reconhecimento ou permita que a biblioteca seja dimensionada automaticamente para o número de núcleos do processador.
- Liberte a CPU descarregando os cálculos para o back -end .NET.
Reconhecimento rápido - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconhecer uma única linha
Se sua imagem já estiver aparada para uma única linha de texto, ela poderá ser reconhecida no modo mais rápido possível, sem correções automatizadas, detecção da estrutura de conteúdo e outras etapas que consomem recursos. Ele pode acelerar o OCR até 7 vezes mais rápido que o processo de reconhecimento normal.
Reconhecer uma única linha de texto na imagem - python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)