¿Por qué optar por Aspose.OCR para Python a través de .NET?

Embárquese en un viaje con Aspose.OCR para Python a través de .NET, una API de OCR versátil y fácil de usar. Incorpore la funcionalidad OCR en sus aplicaciones Python con menos de cinco líneas de código, eliminando la necesidad de redes neuronales o matemáticas complejas. Nuestro potente motor de OCR ofrece velocidad y precisión incomparables y admite 28 idiomas, incluidos alfabetos latino, cirílico y chino. Ya sean imágenes escaneadas, fotografías de teléfonos inteligentes, capturas de pantalla o archivos PDF escaneados, obtenga resultados en formatos populares de intercambio de datos y documentos. Aproveche los filtros de preprocesamiento para manejar imágenes rotadas, sesgadas y ruidosas. Optimice el rendimiento del reconocimiento y la carga del sistema descargando tareas que consumen muchos recursos al backend de .NET.

Illustration ocr

Dominio del OCR eficiente y preciso

Experimente una velocidad y precisión incomparables en los resultados de OCR con la tecnología avanzada Python y .NET.

Excelencia multilingüe

Reconozca texto en 28 idiomas, que abarcan escrituras latina, cirílica y china con facilidad y precisión.

Procesamiento de imágenes adaptable

Procese sin esfuerzo imágenes de diversas fuentes (escáneres, cámaras y teléfonos inteligentes) utilizando Python y .NET.

Dominio del carácter chino

Logre un reconocimiento preciso de más de 6000 caracteres chinos, garantizando la precisión con Python y .NET.

Preservación de estilos y formatos de fuente

Mantenga los estilos de fuente y el formato para una representación precisa del texto, mejorando la versatilidad con Python y .NET.

Ejemplo de código en vivo

Experimente la simplicidad: ¡convierta una imagen en texto en solo tres líneas de código Python!

Listo para reconocer Listo para reconocer Suelta un archivo aquí o haz clic para explorar *

* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.

Resultado del reconocimiento
 

Convertir imagen a texto

Descubra más ejemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Empoderamiento de .NET para Python en cada rincón

Aspose.OCR para Python a través de .NET funciona perfectamente en cualquier plataforma que admita .NET Framework 4.0 y posterior , ya sea una máquina local, web servidor o la nube.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo admitidos

Aspose.OCR for Python via .NET puede trabajar con prácticamente cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y archivos más populares que se pueden guardar, importar a una base de datos o analizar en tiempo real.

Imágenes

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR por lotes

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Resultados del reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalación para Python con backend .NET

Aspose.OCR para Python a través de .NET se entrega como un paquete Python con dependencias mínimas o como un archivo descargable . Instálelo fácilmente en su proyecto y estará listo para reconocer textos en varios idiomas admitidos y guardar los resultados del reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación de OCR completamente funcional y sin limitaciones.

Potente OCR para aplicaciones Python

Nuestra biblioteca se integra fácilmente, lo que permite que las aplicaciones Python se ejecuten sin problemas en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.

28 idiomas de reconocimiento

Nuestra API de Python y .NET OCR reconoce una gran cantidad de lenguajes y scripts de escritura populares, incluidos lenguajes mixtos:

Deje la detección de idioma en manos de la biblioteca o defina el idioma usted mismo para mejorar el rendimiento y la confiabilidad del reconocimiento.

  • Alfabeto latino extendido: alemán, croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco;
  • Alfabeto cirílico: bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano;
  • Chino: más de 6000 caracteres;
  • Hindi.

Potentes filtros de procesamiento

La precisión y confiabilidad del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose.OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes manuales y totalmente automatizados que mejoran una imagen antes de enviarla al motor de OCR:

  • Enderezar automáticamente las imágenes alineadas con un ligero ángulo con respecto a la horizontal.
  • Gire manualmente imágenes muy sesgadas.
  • Elimina automáticamente suciedad, manchas, rayones, reflejos, gradientes no deseados y otros ruidos.
  • Ajusta automáticamente el contraste de la imagen.
  • Mejora automáticamente o cambia el tamaño de la imagen manualmente.
  • Convierte imágenes a blanco y negro o escala de grises.
  • Invierta los colores de la imagen para que las áreas claras parezcan oscuras y las áreas oscuras parezcan claras.
  • Aumenta el grosor de los caracteres de una imagen.
  • Desenfoque las imágenes ruidosas conservando los bordes de las letras.
  • Enderezar la curvatura de la página y corregir la distorsión de la lente de la cámara para las fotografías de la página.

Optimizado para tipos de documentos específicos

Aspose.OCR para Python vía .NET ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

Corrector ortográfico incorporado

Aunque Aspose.OCR para Python a través de .NET proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden provocar que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que busca y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.

Reconocimiento por lotes simplificado

Nuestra API Python OCR le libera de reconocer imágenes una por una. Emplee varios métodos de procesamiento por lotes para reconocer varias imágenes en una sola llamada:

  • Reconocimiento de archivos PDF, TIFF y DjVu de varias páginas.
  • Reconocimiento de todos los archivos de una carpeta.
  • Reconocimiento de todos los archivos de un archivo.
  • Reconocimiento de todos los archivos de una lista.

Aprender a través de ejemplos de Python

Aspose.OCR para Python vía .NET proporciona una variedad de ejemplos escritos en Python, lo que le permite familiarizarse rápidamente con sus funciones. y capacidades. Obtenga información para crear soluciones personalizadas que satisfagan sus necesidades comerciales de Python.

Características y capacidades

Aspose.OCR for Python via .NET Explore las capacidades avanzadas de Aspose.OCR para C++.

Feature icon

OCR de fotos

Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.

Feature icon

PDF con capacidad de búsqueda

Convierta cualquier escaneo en un documento indexable y con capacidad de búsqueda completa.

Feature icon

reconocimiento de URL

Reconocer una imagen desde la URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identifique y reconozca texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento preciso

Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.

Feature icon

Corrector ortográfico

Mejore los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Buscar texto en imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imágenes

Compare textos en dos imágenes, independientemente del caso y el diseño.

Ejemplos de código Python

Profundice en ejemplos de código para integrar perfectamente Aspose.OCR para Python a través de .NET en sus aplicaciones Python.

Dominio de la instalación en Python

Distribuido como Python Wheel o paquete descargable independiente, Aspose.OCR para Python a través de .NET se distribuye fácilmente. La integración en su proyecto Python, directamente desde su entorno de desarrollo integrado (IDE) Python preferido, es un proceso perfecto. Simplemente instálelo y estará preparado para aprovechar la gama completa de capacidades de OCR, guardando los resultados del reconocimiento en varios formatos.

Después de la instalación, puede comenzar a usar Aspose.OCR para Python a través de .NET inmediatamente , aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permitirá tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de .NET en una etapa posterior.

Cargar licencia

lic = License()
lic.set_license(self.licPath)

Reconocer texto en fotos

Leer texto de cualquier contenido en Aspose.OCR para Python a través de .NET es tan fácil como llamar a un método universal de reconocimiento().

Convertir foto en texto - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Convertidor universal de Python

Nuestra API lee hábilmente cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, imágenes JPEG, PNG, TIFF, GIF, BMP e incluso archivos DjVu. La compatibilidad total con documentos PDF de varias páginas, TIFF e imágenes DjVu garantiza la versatilidad. También puedes proporcionar una imagen de la web a través de una URL.

Los resultados del reconocimiento se devuelven en formatos populares de intercambio de datos y documentos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.

Reconocer PDF y guardar resultados en varios formatos de salida - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimización de recursos en Python

El reconocimiento óptico de caracteres exige recursos. Nuestra API ofrece formas flexibles de equilibrar la clásica tríada tiempo-precio-calidad:

  • Elija entre reconocimiento exhaustivo y reconocimiento rápido.
  • Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca escale automáticamente a la cantidad de núcleos de procesador.
  • Libere la CPU descargando los cálculos al backend .NET.

Reconocimiento rápido: Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconocer una sola línea

Si su imagen ya está recortada a una sola línea de texto, puede reconocerse en el modo más rápido posible, sin correcciones automáticas, detección de estructura de contenido y otros pasos que consumen recursos. Puede acelerar el OCR hasta 7 veces más rápido que el proceso de reconocimiento normal.

Reconocer una sola línea de texto en una imagen - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)