Aspose.OCR for Java 允许您从图像、屏幕截图、图像的特定区域提取文本,并从支持 Java 的任何平台上的扫描文件创建可搜索的 PDF。凭借其强大且易于使用的 API,即使是复杂的 OCR 任务也只需不到 10 行代码。您无需使用公式和机器学习 - 该库将处理所有技术细节,并根据拉丁文和西里尔字母以及中文以26种语言生成可靠的结果。 OCR API 处理扫描的图像、智能手机照片、屏幕截图、图像区域和扫描的 PDF,并以最流行的文档格式返回结果。通过跨多个 CPU 内核分配计算并将资源密集型任务卸载到GPU可以进一步提高识别速度、准确性和性能。
Aspose.OCR for Java 的特性和功能
识别扫描图像和 PDF 中的格式化文本
支持您可以从扫描仪或相机获得的所有文件格式
阅读拉丁文和西里尔文脚本
识别6000多个汉字
检测并识别所有流行的字体
仔细保留字体样式和格式
仅处理整个图像或选定区域
支持旋转、倾斜和嘈杂的图像
批量识别文件夹或存档中的所有图像
识别作为 Web 链接提供的图像
查找并自动更正拼写错误的单词
与其他 Aspose 产品 100% 兼容
$Easy to Use$
图像识别需要几行代码。字面上地。这真的很简单 - 试试自己:
7行图像到文本 - Java
// 创建 OCR API 实例
AsposeOCR api = new AsposeOCR();
try {
// 识别图像
String result = api.RecognizePage(imagePath);
// 显示识别结果
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// 错误处理
e.printStackTrace();
}
26种识别语言
OCR API 支持大量语言和所有流行的书写脚本,包括混合语言的文本。内置拼写检查器自动替换拼写错误的单词,省去您手动更正识别结果的麻烦。
- 扩展拉丁字母:克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、瑞典语。
- 西里尔字母:白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
- 中文:6000多个字符。
您可以指定语言以提高识别性能和可靠性,或让 API 自动检测语言。
保留格式
OCR API 以常规、粗体和斜体样式读取所有流行的字体,例如 Arial、Times New Roman、Courier New、Tahoma、Calibri 等,并仔细保留 OCR 结果中的格式。您还可以将识别结果拆分为行并检测页面中的文本区域。
识别照片
扫描仪在最终用户工作站上并不总是可用,这可能成为 OCR 应用程序的阻碍。我们的 OCR API 提供了许多预处理过滤器,可以处理扭曲、旋转、倾斜和嘈杂的图像。结合对所有图像格式的支持,它甚至可以可靠地识别智能手机照片。大多数预处理和图像校正都是自动完成的,但您始终可以在困难的情况下进行干预。
应用图像校正 - Java
// 创建 OCR API 实例
AsposeOCR api = new AsposeOCR();
// 定义预处理过滤器
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// 识别前预处理图像
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// 识别图像
RecognitionResult result = api.RecognizePage(imageRes, set);
性能优化
光学字符识别需要大量的处理资源,这可能成为 Web 服务和入门级设备的问题。 API 提供了非常灵活的方法来平衡识别速度、资源要求和准确性:
- 在彻底识别和快速识别之间进行选择。
- 指定为识别分配的线程数,或允许库自动缩放到 CPU 内核数。
- 通过将计算卸载到 GPU 来释放 CPU。
快速识别 - Java
// 创建 OCR API 实例
AsposeOCR api = new AsposeOCR();
// 以最快的模式识别图像
String result = api.RecognizePageFast("sample.jpg");
批量处理
OCR API 通过提供各种允许您在一次调用中识别多个图像的批处理方法,使您不必一次识别每个图像:
- 识别多页 PDF 和 TIFF 文件。
- 识别档案中的所有文件。
- 识别文件夹中的所有文件。