HTML JPG OCR XML BMP
Aspose.OCR  para {plataforma de idioma}
Searchable PDF

Aspose.Imaging para Java

procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato JPEG y crea documentos JPEG que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR

Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Con C++ OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen JPEG en un documento Searchable PDF:

  • Crear una instancia de la clase AsposeOcr
  • Llamar al método AsposeOCR.asposeocr_page()
  • Pase la ruta del archivo JPEG como parámetro
  • AsposeOCR.asposeocr_page devuelve una cadena o archivo de tipo Searchable PDF

Requisitos del sistema

Antes de ejecutar el ejemplo, asegúrese de que Microsoft.ML.OnnxRuntime 1.7.0 o superior se agregue al proyecto. Debería instalarse automáticamente si instala Aspose.OCR a través de NuGet Package Manager.

  • Solución compatible con NET Standard 2.0+
  • Aspose.OCR para .NET referenciado en su proyecto.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JPEG Que es JPEG Formato de archivo

    Un JPEG es un tipo de formato de imagen que se guarda mediante el método de compresión con pérdida. La imagen de salida, como resultado de la compresión, es un equilibrio entre el tamaño de almacenamiento y la calidad de la imagen. Los usuarios pueden ajustar el nivel de compresión para lograr el nivel de calidad deseado y, al mismo tiempo, reducir el tamaño de almacenamiento. La calidad de la imagen se ve afectada de manera insignificante si se aplica una compresión de 10:1 a la imagen. Cuanto mayor sea el valor de compresión, mayor será la degradación de la calidad de la imagen.

    Lee mas

    Searchable PDF Que es Searchable PDF Formato de archivo

    Los archivos PDF que admiten búsquedas conservan la imagen escaneada original para su visualización, así como el texto OCR en una capa oculta que se puede utilizar para búsquedas de texto completo dentro de un documento o para resaltar texto para operaciones de copiar y pegar. La conversión completa de OCR a PDF, sin incluir la imagen original, nunca conservará el 100 % del formato original, especialmente si el documento tiene muchas imágenes o un diseño complejo.

    Lee mas

    TXT (Archivo de documento de texto)
    Text (Archivo de documento de texto)
    DOC (Documentos generados por Microsoft Word)
    DOCX (Documentos de Microsoft Word)
    XLS (Formato de archivo binario de Microsoft Excel)
    XLSX (Documentos de Microsoft Excel)
    PDF (Formato de documento portátil (PDF))
    Searchable PDF (Gráficos de red portátiles con capacidad de búsqueda)