Aspose.OCR  for Java

在 Java 中将图像和 PDF 转换为文本

使用光学字符识别 (OCR) 功能轻松创建跨平台 Java 应用程序。

  Download Free Trial
  
 

Aspose.OCR for Java 允许您从图像、屏幕截图、图像的特定区域提取文本,并从支持 Java 的任何平台上的扫描文件创建可搜索的 PDF。凭借其强大且易于使用的 API,即使是复杂的 OCR 任务也只需不到 10 行代码。您无需使用公式和机器学习 - 该库将处理所有技术细节,并根据拉丁文西里尔字母以及中文26种语言生成可靠的结果。 OCR API 处理扫描的图像、智能手机照片、屏幕截图、图像区域和扫描的 PDF,并以最流行的文档格式返回结果。通过跨多个 CPU 内核分配计算并将资源密集型任务卸载到GPU可以进一步提高识别速度、准确性和性能。

Aspose.OCR for Java 的特性和功能

识别扫描图像和 PDF 中的格式化文本

支持您可以从扫描仪或相机获得的所有文件格式

阅读拉丁文和西里尔文脚本

识别6000多个汉字

检测并识别所有流行的字体

仔细保留字体样式和格式

仅处理整个图像或选定区域

支持旋转、倾斜和嘈杂的图像

批量识别文件夹或存档中的所有图像

识别作为 Web 链接提供的图像

查找并自动更正拼写错误的单词

与其他 Aspose 产品 100% 兼容

易于安装

您可以按照简单的安装说明直接从基于Maven的项目中使用 Aspose.OCR for Java。

申请临时许可证以开始构建功能齐全的 OCR 应用程序,不受任何限制。

$Easy to Use$

图像识别需要几行代码。字面上地。这真的很简单 - 试试自己:

7行图像到文本 - Java

// 创建 OCR API 实例
AsposeOCR api = new AsposeOCR();

try {
    // 识别图像
    String result = api.RecognizePage(imagePath);
    // 显示识别结果
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // 错误处理
    e.printStackTrace();
}

26种识别语言

OCR API 支持大量语言和所有流行的书写脚本,包括混合语言的文本。内置拼写检查器自动替换拼写错误的单词,省去您手动更正识别结果的麻烦。

  • 扩展拉丁字母:克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、瑞典语。
  • 西里尔字母:白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
  • 中文:6000多个字符。

您可以指定语言以提高识别性能和可靠性,或让 API 自动检测语言。

保留格式

OCR API 以常规、粗体和斜体样式读取所有流行的字体,例如 Arial、Times New Roman、Courier New、Tahoma、Calibri 等,并仔细保留 OCR 结果中的格式。您还可以将识别结果拆分为行并检测页面中的文本区域。

识别照片

扫描仪在最终用户工作站上并不总是可用,这可能成为 OCR 应用程序的阻碍。我们的 OCR API 提供了许多预处理过滤器,可以处理扭曲、旋转、倾斜和嘈杂的图像。结合对所有图像格式的支持,它甚至可以可靠地识别智能手机照片。大多数预处理和图像校正都是自动完成的,但您始终可以在困难的情况下进行干预。

应用图像校正 - Java

// 创建 OCR API 实例
AsposeOCR api = new AsposeOCR();

// 定义预处理过滤器
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// 识别前预处理图像
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// 识别图像
RecognitionResult result = api.RecognizePage(imageRes, set);

性能优化

光学字符识别需要大量的处理资源,这可能成为 Web 服务和入门级设备的问题。 API 提供了非常灵活的方法来平衡识别速度、资源要求和准确性:

  • 在彻底识别和快速识别之间进行选择。
  • 指定为识别分配的线程数,或允许库自动缩放到 CPU 内核数。
  • 通过将计算卸载到 GPU 来释放 CPU。

快速识别 - Java

// 创建 OCR API 实例
AsposeOCR api = new AsposeOCR();

// 以最快的模式识别图像
String result = api.RecognizePageFast("sample.jpg");

批量处理

OCR API 通过提供各种允许您在一次调用中识别多个图像的批处理方法,使您不必一次识别每个图像:

  • 识别多页 PDF 和 TIFF 文件。
  • 识别档案中的所有文件。
  • 识别文件夹中的所有文件。
  

Support and Learning Resources

  
  

Aspose 还为其他流行的编程语言提供原生 OCR API: