为什么选择Aspose OCR库作为Java?

使用Aspose OCR Java库解锁强大的OCR。我们的Java API是一种有效,用户友好且具有成本效益的OCR API。在仅五行Java代码中,在您的应用程序中添加功能强大的OCR功能而无需了解神经网络和其他技术细节。

我们的OCR引擎提供了无与伦比的速度和准确性,支持140多种语言,包括英语,西里尔,西拉米克语,阿拉伯语,中国,日本,韩国,韩国,印地语,tami,Tamil和更多语言。无论您是使用扫描,智能手机照片,屏幕截图还是PDF,我们的OCR提取物,都以所有流行格式生成结果。
图像预处理预处理自动纠正旋转,模糊,倒置和嘈杂的图像,以确保在任何条件下最高识别精度。

Illustration ocr

迅速而精确的OCR

通过我们的先进Java技术,获得高速且准确的OCR结果。

多语言支持

识别140多种语言的文字,包括英语,法语,西里尔语,阿拉伯语,波斯语,指示,中文,日语,韩语,泰米尔语和其他剧本。

所有图像

从各种来源(例如扫描仪,相机和智能手机)处理图像。

混合语言检测

识别用混合语言编写的文档,例如中文/英语,阿拉伯语/法语,印地语/英语和西里尔/英语。

任何字体,样式和格式

准确地保留文本布局,检测表结构,并无缝识别文本,而不管字体样式如何。

实时代码样本

体验简单性:将图像转换为文本中的几行Java代码

准备识别 准备识别 在此处放置文件或单击浏览 *

*通过上传文件或使用您同意我们的服务 使用条款隐私政策.

识别结果
 

将图像转换为文字

探索更多示例 >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

跨平台

Aspose Java OCR代码在支持[Java SE 6.0或更高版本]的任何平台上无缝操作(https://docs.aspose.com/ocr/java/system-requirements/) - 是本地机器,Web服务器或云。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Java 可以使用任何 文件 您可以从扫描仪或相机中获得。识别结果可以保存,导入到数据库或实时分析。

图像

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

识别结果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

易于安装

aspose.ocr for Java被分配为轻量级Java存档(JAR)文件或[可下载文件](https://releases.aspose.com/ocr/java/),具有最小的依赖关系。只需[install](https://docs.aspose.com/ocr/java/installation/)它进入您的项目,您都将以多种支持语言识别文本并以各种格式识别识别结果。

[请求试用许可证](https://purchase.aspose.com/temporary-license),以启动无限制的功能性OCR应用程序的开发。

到处都可以工作

我们的Java库完全支持Java SE 6或更高版本,使您的应用程序能够在任何平台上无缝运行 - 桌面Windows,Windows Server,Macos,Linux和The Cloud。

140多种识别语言

我们的Java OCR库是在全球范围内用于文档处理,数据提取和内容数字化的通用解决方案。为了支持各种欧洲,中东和亚洲写作脚本,它适合任何国家和商业。

Java的Aspose OCR在多语言文档中识别文本,例如中文/英语,阿拉伯语/法语或西里尔/英语。支持以下语言:

  • 扩展拉丁语:英语,西班牙语,法语,印尼,葡萄牙语,德国,越南语,土耳其语,意大利语,波兰语和80岁以上;
  • 西里尔字母:俄罗斯,乌克兰,哈萨克,保加利亚人,包括混合的西里尔/英语文本;
  • 阿拉伯语,波斯语,乌尔都语,包括与英语混合的文字;
  • 中文,韩国,日本,德文纳加里和德拉维语,包括印地语,泰米尔语,马拉地语等。

功能和功能

Aspose.OCR for Java 探索Java Aspose OCR的高级功能和功能。

Feature icon

照片OCR

从智能手机照片中提取文字,具有扫描级别的精度。

Feature icon

可搜索的PDF

将任何扫描转换为可搜索且可编辑的文档。

Feature icon

URL识别

识别来自URL的图像而无需在本地下载。

Feature icon

散装认可

阅读来自多页文档,文件夹和档案的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式中的文本。

Feature icon

微调识别

调整每个OCR参数以获得最佳识别结果。

Feature icon

拼写检查器

通过自动纠正拼写错误的单词来改善结果。

Feature icon

在图像中找到文字

在一组图像中搜索文本或正则表达式。

Feature icon

比较图像文本

无论情况和布局如何,都比较两个图像上的文本。

Feature icon

全世界

用自动语言检测提取任何语言的文本。

Feature icon

关键细节提取

自动从身份证中提取重要细节。

Feature icon

与Aspose解决方案完全集成

将OCR与其他Aspose产品无缝集成,以实现全面有效的Java解决方案。

代码样本

探索代码示例,以了解如何将OCR API无缝集成到Java应用程序中。

安装

作为具有最小依赖关系或Maven存储库的Java存档(JAR)文件,很容易分发Java的Aspose OCR。直接从您首选的Java集成开发环境(IDE)中集成到您的项目中,是一个无缝的过程。只需安装它,就准备好利用OCR功能的完整范围,以任何受支持的格式保存识别结果。

后安装后,您可以迅速开始使用Aspose.omr for Java,尽管有某些限制。临时许可将使所有试用版本限制30天。利用此期间启动功能齐全的OCR应用程序的开发,使您可以在以后的阶段做出明智的购买aspose.ocr.ocr。

识别Java中扫描图像的文字

克服缺乏广泛扫描仪的OCR应用的挑战。我们的API拥有功能强大的内置图像预处理过滤器,这些过滤器巧妙地处理旋转,偏斜和嘈杂的图像。结合对所有图像格式的支持,它即使在智能手机照片中也可以确保可靠的识别。大多数预处理和图像校正都是自动化的,只需要在具有挑战性的情况下进行干预。

应用自动图像更正-Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

从Java中的照片中提取文字

在Java应用程序中整合文本检测和识别。访问精确的照片可以轻松地从照片中获得,从而增强了您的图像处理功能。提升图像处理功能,从照片中获得准确的结果。

在照片上检测并识别文本-Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java中的资源优化

光学特征识别需要资源。我们的API提供了平衡经典时间价格质量三合会的灵活方法。它允许您限制识别引擎使用的线程数。尽管此调整可能会导致识别速度较慢,但它使您可以为并发任务分配资源,例如并行图像处理,Web服务器操作,数据库管理或背景数据分析。

  • 在透彻识别和快速识别之间进行选择。
  • 指定分配识别的线程数,或允许库自动扩展到处理器内核的数量。
  • 通过将计算释放到GPU来释放CPU。

平衡资源

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

用最少的设置快速识别

如果您的图像是高质量的扫描而没有偏斜或失真,则可以使用最快的识别模式,该模式使用以下方式消耗最低可能的资源:

快速识别OCR -Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});