Por que optar pelo Aspose.OCR para Python via .NET?

Embarque em uma jornada com Aspose.OCR para Python via .NET – uma API de OCR versátil e fácil de usar. Incorpore a funcionalidade OCR em seus aplicativos Python com menos de cinco linhas de código, eliminando a necessidade de matemática complexa ou redes neurais. Nosso poderoso mecanismo de OCR oferece velocidade e precisão incomparáveis, suportando 28 idiomas, incluindo escritas latinas, cirílicas e chinesas. Quer sejam imagens digitalizadas, fotos de smartphones, capturas de tela ou PDFs digitalizados, obtenha resultados em formatos populares de documentos e troca de dados. Aproveite filtros de pré-processamento para lidar com imagens giradas, distorcidas e com ruído. Otimize o desempenho de reconhecimento e a carga do sistema transferindo tarefas que consomem muitos recursos para o back-end do .NET.

Illustration ocr

Domínio de OCR eficiente e preciso

Experimente velocidade e precisão incomparáveis ​​nos resultados de OCR com tecnologia avançada Python e .NET.

Excelência Multilíngue

Reconheça texto em 28 idiomas, abrangendo escritas latina, cirílica e chinesa com facilidade e precisão.

Processamento de imagem adaptável

Processe facilmente imagens de diversas fontes – scanners, câmeras e smartphones – usando Python e .NET.

Proficiência em caracteres chineses

Obtenha reconhecimento preciso de mais de 6.000 caracteres chineses, garantindo precisão com Python e .NET.

Preservação de estilos e formatos de fontes

Mantenha estilos de fonte e formatação para representação de texto precisa, aumentando a versatilidade com Python e .NET.

Amostra de código ativo

Experimente a simplicidade: converta uma imagem em texto em apenas três linhas de código Python!

Pronto para reconhecer Pronto para reconhecer Solte um arquivo aqui ou clique para navegar *

* Ao enviar seus arquivos ou usar o serviço você concorda com nosso Termos de uso e política de Privacidade.

Resultado de reconhecimento
 

Converter imagem em texto

Descubra mais exemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Capacitação do .NET para Python em todos os cantos

Aspose.OCR para Python via .NET opera perfeitamente em qualquer plataforma que suporte .NET Framework 4.0 e posterior – seja uma máquina local, web servidor ou nuvem.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de arquivo suportados

Aspose.OCR for Python via .NET pode trabalhar com praticamente qualquer arquivo você pode obter de um scanner ou câmera. Os resultados do reconhecimento são retornados nos formatos mais populares de arquivos e troca de dados que podem ser salvos, importados para um banco de dados ou analisados ​​em tempo real.

Imagens

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR em lote

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Resultados de reconhecimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalação para Python com backend .NET

Aspose.OCR para Python via .NET é entregue como um pacote Python com dependências mínimas ou como um arquivo para download . Instale facilmente em seu projeto e você estará pronto para reconhecer textos em vários idiomas suportados e salvar resultados de reconhecimento em vários formatos.

Solicite uma licença de teste para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional e sem limitações.

OCR poderoso para aplicativos Python

Nossa biblioteca se integra facilmente, permitindo que aplicativos Python sejam executados perfeitamente em qualquer plataforma – desktop Windows, Windows Server, macOS, Linux e nuvem.

28 idiomas de reconhecimento

Nossa API Python e .NET OCR reconhece uma infinidade de linguagens e scripts de escrita populares, incluindo linguagens mistas:

Deixe a detecção de idioma para a biblioteca ou defina você mesmo o idioma para melhorar o desempenho e a confiabilidade do reconhecimento.

  • Alfabeto latino estendido: croata, tcheco, dinamarquês, holandês, inglês, estoniano, finlandês, francês, alemão, italiano, letão, lituano, norueguês, polonês, português, romeno, eslovaco, esloveno, espanhol, sueco;
  • Alfabeto Cirílico: Bielorrusso, Búlgaro, Cazaque, Russo, Sérvio, Ucraniano;
  • Chinês: Mais de 6.000 caracteres;
  • Hindi.

Filtros de processamento poderosos

A precisão e a confiabilidade do reconhecimento óptico de caracteres dependem altamente da qualidade da imagem original. Aspose.OCR para Python via .NET oferece um grande número de filtros de processamento de imagem totalmente automatizados e manuais que aprimoram uma imagem antes de ela ser enviada ao mecanismo de OCR:

  • Endireite automaticamente as imagens alinhadas em um leve ângulo em relação à horizontal.
  • Gire manualmente imagens muito distorcidas.
  • Remova automaticamente sujeira, manchas, arranhões, brilho, gradientes indesejados e outros ruídos.
  • Ajusta automaticamente o contraste da imagem.
  • Aumente a escala automaticamente ou redimensione manualmente a imagem.
  • Converta imagens em preto e branco ou em tons de cinza.
  • Inverta as cores da imagem para que as áreas claras pareçam escuras e as áreas escuras pareçam claras.
  • Aumente a espessura dos caracteres em uma imagem.
  • Desfoque imagens barulhentas preservando as bordas das letras.
  • Endireite a curvatura da página e corrija a distorção da lente da câmera nas fotos da página.

Otimizado para tipos de documentos específicos

Aspose.OCR para Python via .NET oferece redes neurais especialmente treinadas para extrair texto de certos tipos de imagens com máxima precisão:

Verificador ortográfico integrado

Embora Aspose.OCR para Python via .NET forneça alta precisão de reconhecimento, defeitos de impressão, sujeira ou fontes fora do padrão podem fazer com que certos caracteres ou palavras sejam reconhecidos incorretamente. Para melhorar ainda mais os resultados de reconhecimento, você pode ativar o corretor ortográfico, que localiza e corrige automaticamente erros ortográficos com base no idioma de reconhecimento selecionado.

Se o texto reconhecido contiver terminologia especializada, abreviações e outras palavras que não estejam presentes nos dicionários ortográficos comuns, você poderá fornecer suas próprias listas de palavras.

Reconhecimento de lote simplificado

Nossa API Python OCR libera você do reconhecimento de imagens uma por uma. Empregue vários métodos de processamento em lote para reconhecer várias imagens em uma chamada:

  • Reconhecimento de arquivos PDF, TIFF e DjVu de várias páginas.
  • Reconhecimento de todos os arquivos em uma pasta.
  • Reconhecimento de todos os arquivos em um arquivo.
  • Reconhecimento de todos os arquivos de uma lista.

Aprendendo com exemplos de Python

Aspose.OCR para Python via .NET fornece uma variedade de exemplos escritos em Python, permitindo que você se familiarize rapidamente com suas funções e capacidades. Obtenha insights para criar soluções personalizadas para atender às suas necessidades de negócios em Python.

Recursos e capacidades

Aspose.OCR for Python via .NET Explore os recursos avançados do Aspose.OCR para C++.

Feature icon

OCR de fotos

Extraia texto de fotos de smartphones com precisão de digitalização.

Feature icon

PDF pesquisável

Converta qualquer digitalização em um documento totalmente pesquisável e indexável.

Feature icon

Reconhecimento de URL

Reconheça uma imagem do URL sem baixá-la localmente.

Feature icon

Reconhecimento em massa

Leia todas as imagens de documentos, pastas e arquivos de várias páginas.

Feature icon

Qualquer fonte e estilo

Identifique e reconheça texto em todos os tipos e estilos populares.

Feature icon

Reconhecimento de ajuste fino

Ajuste todos os parâmetros de OCR para obter melhores resultados de reconhecimento.

Feature icon

Verificador ortográfico

Melhore os resultados corrigindo automaticamente palavras com erros ortográficos.

Feature icon

Encontre texto em imagens

Pesquise texto ou expressão regular em um conjunto de imagens.

Feature icon

Compare textos de imagens

Compare textos em duas imagens, independentemente do caso e do layout.

Amostras de código Python

Aprofunde-se em exemplos de código para integrar perfeitamente o Aspose.OCR para Python via .NET em seus aplicativos Python.

Domínio de instalação em Python

Distribuído como um Python Wheel ou um pacote independente para download, o Aspose.OCR para Python via .NET é facilmente distribuído. A integração em seu projeto Python, diretamente de seu ambiente de desenvolvimento integrado (IDE) Python preferido, é um processo contínuo. Basta instalá-lo e você estará preparado para aproveitar toda a gama de recursos de OCR, salvando resultados de reconhecimento em vários formatos.

Após a instalação, você pode começar imediatamente a usar o Aspose.OCR para Python via .NET , embora com certas limitações. Uma licença temporária elimina todas as restrições da versão de teste por 30 dias. Utilize este período para iniciar o desenvolvimento de um aplicativo OCR totalmente funcional, permitindo que você tome uma decisão informada sobre a compra do Aspose.OCR para Python via .NET posteriormente.

Carregar licença

lic = License()
lic.set_license(self.licPath)

Reconhecer texto em fotos

Ler texto de qualquer conteúdo em Aspose.OCR para Python via .NET é tão fácil quanto chamar um método reconhecível() universal.

Converter foto em texto - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Conversor Universal Python

Nossa API lê habilmente qualquer imagem de scanners, câmeras ou smartphones: documentos PDF, JPEG, PNG, TIFF, GIF, imagens BMP e até arquivos DjVu. Suporte total para documentos PDF de várias páginas, imagens TIFF e DjVu garantem versatilidade. Você também pode fornecer uma imagem da web por meio de um URL.

Os resultados do reconhecimento são retornados em formatos populares de documentos e troca de dados: texto simples, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Reconheça PDF e salve resultados em vários formatos de saída - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Otimização de recursos em Python

O reconhecimento óptico de caracteres exige recursos. Nossa API oferece maneiras flexíveis de equilibrar a clássica tríade tempo-preço-qualidade:

  • Escolha entre reconhecimento completo e reconhecimento rápido.
  • Especifique o número de threads alocados para reconhecimento ou permita que a biblioteca seja dimensionada automaticamente para o número de núcleos do processador.
  • Libere a CPU transferindo cálculos para o back-end do .NET.

Reconhecimento rápido - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconhecer linha única

Se sua imagem já estiver cortada em uma única linha de texto, ela poderá ser reconhecida no modo mais rápido possível, sem correções automatizadas, detecção de estrutura de conteúdo e outras etapas que consomem recursos. Ele pode acelerar o OCR até 7 vezes mais rápido que o processo normal de reconhecimento.

Reconhecer uma única linha de texto na imagem - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)