为什么选择 Aspose.OCR for Java?

探索 Aspose.OCR for Java 的无缝世界——一个强大、易于使用且经济高效的 OCR API。只需不到 5 行 Java 代码,即可将 OCR 功能添加到您的应用程序中,而无需深入研究复杂的数学或神经网络。我们强大的 OCR 引擎拥有卓越的速度和准确性,支持 130 多种语言,包括拉丁语、西里尔语、阿拉伯语、波斯语、梵文和中文脚本。从扫描图像和智能手机照片到屏幕截图和扫描 PDF,以流行的文档和数据交换格式检索结果。受益于处理旋转、倾斜和噪声图像的预处理滤镜。通过将资源密集型任务卸载到 GPU 来优化识别性能和系统负载。

Illustration ocr

快速、准确的 OCR

利用我们先进的 Java 技术实现高速、准确的 OCR 结果。

多语言支持

识别 130 多种语言的文本,包括拉丁文、西里尔文、阿拉伯文、波斯文、印度文和中文文字。

自适应图像支持

处理来自各种来源的图像,例如扫描仪、相机和智能手机。

汉字掌握

以无与伦比的精度识别 6,000 多个汉字。

字体样式和格式完整性

保留字体样式和格式以忠实表示已识别的 Java 文本。

实时代码示例

体验简单性:只需几行 Java 代码即可将图像转换为文本!

准备好识别 准备好识别 将文件拖放到此处或单击浏览*

* 通过上传您的文件或使用我们的服务,您同意我们的 使用条款隐私政策.

识别结果
 

将图像转换为文本

探索更多示例 >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java无处不在

Aspose.OCR for Java 可在任何支持 Java SE 6.0 或更高版本 的平台上无缝运行 – 无论是本地计算机、Web 服务器还是云。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Java 几乎可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果以最流行的文件和数据交换格式返回,可以保存、导入数据库或实时分析。

图片

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

识别结果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

轻松安装

Aspose.OCR for Java 作为轻量级 Java 存档 (JAR) 文件或具有最小依赖性的 可下载文件 分发。只需将其 安装 到您的项目中,您就可以识别多种受支持语言的文本并以各种格式保存识别结果。

请求试用许可证 以无限制地开始开发功能齐全的 OCR 应用程序。

爪哇,无处不在

我们的库完全支持 Java SE 6 或更高版本,使您的应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。

130+ 识别语言

我们的 Java OCR API 可识别多种语言和流行的书写脚本,包括混合语言:

将语言检测留给库或您自己定义语言,以增强识别性能和可靠性。

  • 扩展拉丁字母表:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
  • 西里尔文字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
  • 阿拉伯语、波斯语、乌尔都语;
  • 中文和梵文文字,包括印地语、马拉地语、博杰普尔语等。

增强特性和能力

Aspose.OCR for Java 探索 Aspose.OCR for Java 的高级特性和功能。

Feature icon

照片识别

以扫描级精度从智能手机照片中提取文本。

Feature icon

可搜索的 PDF

将任何扫描结果转换为完全可搜索和可索引的文档。

Feature icon

网址识别

从 URL 识别图像,无需下载到本地。

Feature icon

批量识别

读取多页文档、文件夹和档案中的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式的文本。

Feature icon

微调识别

调整每个 OCR 参数以获得最佳识别结果。

Feature icon

拼写检查器

通过自动更正拼写错误的单词来提高结果。

Feature icon

查找图像中的文本

在一组图像中搜索文本或正则表达式。

Feature icon

比较图像文本

比较两个图像上的文本,无论大小写和布局如何。

Feature icon

网页链接图像识别

直接从 Web 链接无缝识别图像,增强 Java 项目中的 OCR 集成。

Feature icon

自动拼写错误的单词更正

通过自动更正拼写错误的单词来增强 OCR 结果,确保 Java 应用程序的准确性。

Feature icon

与 Aspose 生态系统完全集成

将 Aspose.OCR for Java 与其他 Aspose 产品无缝集成,以获得全面、高效的 Java 解决方案。

代码示例

探索代码示例,了解如何将 Aspose.OCR for Java 无缝集成到您的应用程序中。

安装

作为具有最小依赖性或来自 Maven 存储库的 Java 存档 (JAR) 文件,Aspose.OCR for Java 很容易分发。直接从您首选的 Java 集成开发环境 (IDE) 集成到您的项目中是一个无缝的过程。只需安装它,您就可以利用完整的 OCR 功能,以任何支持的格式保存识别结果。

安装后,您可以立即开始使用 Aspose.OMR for Java ,尽管有一定的限制。临时许可证可解除 30 天内的所有试用版限制。利用这段时间开始开发功能齐全的 OCR 应用程序,以便您在稍后阶段做出购买 Aspose.OCR for Java 的明智决定。

使用 Java 识别扫描图像上的文本

克服 OCR 应用程序缺乏广泛扫描仪的挑战。我们的 API 拥有强大的内置图像预处理过滤器,可以熟练处理旋转、倾斜和噪声图像。结合对所有图像格式的支持,即使是智能手机照片也能确保可靠的识别。大多数预处理和图像校正都是自动化的,仅在具有挑战性的情况下才需要您的干预。

应用自动图像校正 - Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

用 Java 从照片中提取文本

将文本检测和识别集成到您的 Java 应用程序中。轻松获取照片的精确结果,增强您的图像处理能力。提升图像处理能力,从照片中获得准确的结果。

检测并识别照片上的文本 - Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java 中的资源优化

光学字符识别需要资源。我们的 API 提供了灵活的方法来平衡经典的时间-价格-质量三元组。它允许您限制识别引擎使用的线程数。虽然此调整可能会导致识别速度变慢,但它使您能够为并行图像处理、Web 服务器操作、数据库管理或后台数据分析等并发任务分配资源。

  • 在彻底识别和快速识别之间进行选择。
  • 指定分配用于识别的线程数,或允许库自动缩放到处理器核心的数量。
  • 通过将计算卸载到 GPU 来释放 CPU。

平衡资源使用

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

只需最少的设置即可快速识别

如果您的图像是高质量扫描件,没有倾斜或失真,您可以使用最快的识别模式,消耗尽可能少的资源:

快速识别 OCR - Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});