为什么aspose.ocr用于c ++?

在本地应用程序,Web服务或云中创建并识别任何布局和复杂性的机器可读形式。我们的解决方案适用于任何规模的项目 - 从简单的调查和测验到期末考试和选举。单击下面的项目以了解有关我们的功能和好处的更多信息。

Illustration ocr

照片OCR

从智能手机照片中提取文字,具有扫描级别的精度。

可搜索的PDF

将任何扫描转换为完全可搜索且可索引的文档。

URL识别

识别来自URL的图像而无需在本地下载。

散装认可

阅读来自多页文档,文件夹和档案的所有图像。

任何字体和样式

识别并识别所有流行字体和样式中的文本。

实时代码样本

体验简单性:将图像转换为文本仅在三行C ++代码中!

准备识别 准备识别 在此处放置文件或单击浏览 *

*通过上传文件或使用您同意我们的服务 使用条款隐私政策.

识别结果
 

将图像转换为文字

发现更多例子 >
  string file = "source.png";
  AsposeOCRInput source;
  source.url = file.c_str();
  vector<AsposeOCRInput> content = {source};
  
  RecognitionSettings settings;
  settings.language_alphabet = language::eng;
  
  size_t size = 0;
  wchar_t* buffer = asposeocr_serialize_result(result, size);
  wcout << wstring(buffer) << endl;

  asposeocr_free_result(result);

到处都是C ++电源

aspose.ocr for C ++在任何平台上无缝操作。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for C++ 可以使用任何 文件 您可以从扫描仪或相机中获得。识别结果可以保存,导入到数据库或实时分析。

图像

  • JPEG
  • PNG
  • TIFF
  • BMP

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

识别结果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

安装

C ++的Aspose.ocr库以nuget软件包或[可下载文件](https://releases.aspose.com/ocr/cpp/)分发,具有最小的依赖关系。轻松[install](https://docs.aspose.com/ocr/cpp/installation/)将其进入您的项目,您可以用多种支持的语言识别文本并以各种格式识别识别结果。

[请求试用许可证](https://purchase.aspose.com/temporary-license),以启动无限制的功能性OCR应用程序的开发。

C ++电源

我们的库完全支持C ++ 11及以后的库,使您的应用程序能够在任何平台上无缝运行 - 台式Windows,Windows Server,MacOS,Linux和Cloud。

140多种识别语言

我们的C ++ OCR API识别出多种语言和流行的写作脚本,包括混合语言:

将语言检测留在图书馆或自己定义语言以增强识别性能和可靠性。

  • 延长拉丁语字母:英语,西班牙语,法语,印尼,葡萄牙语,德国,越南语,土耳其语,意大利语,波兰语等80岁以上;
  • 西里尔字母:俄罗斯,乌克兰,哈萨克,塞尔维亚,白俄罗斯,保加利亚语;
  • 阿拉伯语,波斯语,乌尔都语;
  • 中文和devanagari剧本,包括印地语,马拉地语,博伊布里等。

授权的功能和功能

Aspose.OCR for C++ 发现C ++的Aspose.ocr的高级功能。

Feature icon

照片OCR

从智能手机照片中提取文字,具有扫描级别的精度。

Feature icon

可搜索的PDF

将任何扫描转换为完全可搜索且可索引的文档。

Feature icon

URL识别

识别来自URL的图像而无需在本地下载。

Feature icon

散装认可

阅读来自多页文档,文件夹和档案的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式中的文本。

Feature icon

微调识别

调整每个OCR参数以获得最佳识别结果。

Feature icon

拼写检查器

通过自动纠正拼写错误的单词来改善结果。

Feature icon

在图像中找到文字

在一组图像中搜索文本或正则表达式。

Feature icon

比较图像文本

无论情况和布局如何,都比较两个图像上的文本。

Feature icon

限制识别范围

限制OCR引擎将要寻找的字符集。

Feature icon

检测图像缺陷

自动发现图像的潜在问题领域。

Feature icon

认识区域

找到并仅读取图像的特定区域,而不是全部文本。

C ++代码样本

深入探究代码样本,将C ++的Aspose.ocr无缝集成到您的应用程序中。

C ++安装精通

作为轻巧的C ++存档(LIB)文件或具有最小依赖关系的可下载文件,aspose.ocr for C ++很容易分发。直接从您首选的C ++集成开发环境(IDE)集成到您的项目中,是一个无缝的过程。只需安装它,就准备好利用OCR功能的完整范围,以任何受支持的格式保存识别结果。

后安装后,您可以立即开始使用Aspose.ocr进行C ++,尽管有某些限制。临时许可将使所有试用版本限制30天。利用此期间启动功能齐全的OCR应用程序的开发,使您可以在以后的阶段做出明智的购买aspose.ocr.ocr。

C ++照片的OCR

克服缺乏广泛扫描仪的OCR应用的挑战。我们的API拥有功能强大的内置图像预处理过滤器,这些过滤器巧妙地处理旋转,偏斜和嘈杂的图像。结合对所有图像格式的支持,它即使在智能手机照片中也可以确保可靠的识别。大多数预处理和图像校正都是自动化的,只需要在具有挑战性的情况下进行干预。您也可以预先定义图像区域。

设置偏斜校正和定义识别区域的自定义角度-C ++

string file = "photo.png";
AsposeOCRInput source;
source.url = file.c_str();
std::vector<AsposeOCRInput> content = { source };

// Fine-tune recognition
RecognitionSettings settings;
settings.detect_areas_mode = detect_areas_mode_enum::PHOTO;

// Extract text from the photo
auto result = asposeocr_recognize(content.data(), content.size(), settings);

// Output the recognized text
wchar_t* buffer = asposeocr_serialize_result(result, buffer_size, export_format::text);
std::wcout << std::wstring(buffer) << std::endl;

// Release the resources
asposeocr_free_result(result);

检测图像缺陷

图像缺陷可以显着影响OCR的准确性。它们可能是由图像采集过程,环境条件以及用于捕获图像的硬件的质量引起的。为了提高识别精度,必须尽可能地预处理和增强图像来减轻这些缺陷。

c ++的aspose.ocr可以[自动找到](https://docs.aspose.com/ocr/cpp/cpp/detecting-image-defects/)在识别过程中可能会出现图像的问题区域。您可以在预览图像时突出显示问题区域,甚至使用替代识别设置来获得更好的结果。

识别模糊,扭曲和低对比度图像的文字-C ++

// Provide the image
string file = "source.png";
AsposeOCRInput source;
source.url = file.c_str();
vector<AsposeOCRInput> content = {source};

// Activate detection of low-contrast areas
RecognitionSettings settings;
settings.defect_type = defect_type::ASPOSE_OCR_DETECT_DARK_IMAGES;

// Find and show low-contrast areas
AsposeOCRRecognitionResult result = asposeocr_recognize(content.data(), content.size(), settings);
for (size_t p_number = 0; p_number < result.pages_amount; ++p_number)
{
  cout << "Page " << p_number << ";\n";
  const auto& page = result.recognized_pages[p_number];
  for (size_t defect_number = 0; defect_number < page.defects_count; ++defect_number)
  {
    const auto& defect_area = page.defect_areas[defect_number];
    cout << "Low-contrast area " << defect_number << ":" << defect_area.area << std::endl;
  }
}

// Release the resources
asposeocr_free_result(result);

批处理处理

OCR API通过提供各种批处理方法,使您无法一一识别每个图像,从而使您可以在一个呼叫中识别多个图像:

  • 识别多页PDF和TIFF文件。
  • 识别文件夹中的所有文件。
  • 识别存档中的所有文件。

识别邮政编码-C ++

// Provide a ZIP archive
string file = "pages.zip";
AsposeOCRInput source;
source.url = file.c_str();
std::vector<AsposeOCRInput> content = { source };

// Fine-tune recognition
RecognitionSettings settings;
settings.detect_areas_mode = detect_areas_mode_enum::COMBINE;

// Extract texts
auto result = asposeocr_recognize(content.data(), content.size(), settings);