通过Java将图像转换为文本
识别图像中的文本
更多的展示 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
为什么Aspose.ocr为Python通过Java?
aspose.ocr for Python通过Java无缝无缝将强大的光学特征识别(OCR)功能集成到您的跨平台Python笔记本电脑和应用中。借助我们的直观和高速API,您可以轻松地从扫描,屏幕截图,Web链接或智能手机照片中提取文本,从而提供准备合并,分析或存储的结果。识别扫描的图像,智能手机照片,屏幕截图和扫描PDF,以节省流行文档格式的结果。先进的预处理过滤器旋转,偏斜和嘈杂的图像。通过将任务卸载到GPU来优化性能。

迅速而准确的OCR
通过Java技术,我们的高级Python实现了高速,准确的OCR结果。
多语言支持
识别140多种语言的文本,包括拉丁语,西里尔,阿拉伯语,波斯语,指示和中文脚本,可通过Java确保您的Python应用程序的多功能性。
灵活的图像支持
通过Java与Python无缝地从扫描仪,相机和智能手机处理图像。
汉字认可的精度
通过Java在Python项目中识别超过6,000个汉字。
保留字体样式和格式化
维护字体样式和格式,以通过Java在Python应用程序中准确表示已识别的文本。
实时代码样本
仅以三行代码中的图像启动文本识别。体验简单!
将图像转换为文字
更多例子 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
选择您的偏好
为您的需求选择合适的库。探索可用的API及其选择最有效解决方案的功能。
多功能性
Python via .NET
统一
Python via Java
表现
Python via C++
Java后端兼容性
我们的图书馆设计为Python模块,可确保在支持[Java](https://docs.aspose.com/ocr/java/system-requirements/)的主要操作系统中的兼容性 - 包括Microsoft Windows,Linux,MacOS和MacOS或云平台。这使您能够在一个平台上开发应用程序,并在另一个平台上无缝运行它们,从而消除了对任何代码修改的需求。
支持的文件格式
Aspose.OCR for Python via Java 可以使用任何 文件 您可以从扫描仪或相机中获得。识别结果可以保存,导入到数据库或实时分析。
图像
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
批量OCR
- Multi-page PDF
- ZIP
- Folder
识别结果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
轻松为Python通过Java安装
python的Aspose.ocr通过Java作为Python软件包或[可下载文件](https://releases.aspose.com/ocr/py/python-java/)以最小的依赖性提供。轻松地[install](https://docs.aspose.com/ocr/python-java/installation/)它进入您的项目,您准备以多种支持的语言识别文本并以各种格式保存识别结果。
[请求试用许可证](https://purchase.aspose.com/temporary-license),以启动无限制的功能性OCR应用程序的开发。
强大的OCR用于Python应用程序
我们的库轻松集成,使Python应用程序能够在任何平台上无缝运行 - 桌面Windows,Windows Server,Macos,Linux和The Cloud。
140多种识别语言
我们的Python和Java OCR API识别出大量的语言和流行的写作脚本,包括混合语言:
将语言检测留在图书馆或自己定义语言以增强识别性能和可靠性。
- 延长拉丁语字母:英语,西班牙语,法语,印尼,葡萄牙语,德国,越南语,土耳其语,意大利语,波兰语等80岁以上;
- 西里尔字母:俄罗斯,乌克兰,哈萨克,塞尔维亚,白俄罗斯,保加利亚语;
- 阿拉伯语,波斯语,乌尔都语;
- 中文和devanagari剧本,包括印地语,马拉地语,博伊布里等。
增强的图像处理过滤器
光学特征识别的精度在很大程度上取决于原始图像的质量。 Aspose.ocr for Python通过Java提供了各种各样的自动和手动图像处理过滤器,以在提交OCR引擎之前优化图像:
- 自动拉直稍微倾斜的图像。
- 手动纠正严重偏斜图像的旋转。
- 自动删除污垢,斑点,划痕,眩光,不需要的梯度和其他类型的噪声。
- 自动调整图像对比度。
- 自动高档或手动调整图像大小。
- 将图像转换为黑白或灰色。
- 倒转图像颜色,使光区显得黑暗,黑色区域显得轻。
- 增加图像中字符的厚度。
- 保留字母边缘时模糊的嘈杂图像。
- 页面照片中的页面偏斜并正确的相机镜头失真。
各种文档类型的特定API
Aspose.ocr for Python通过Java提供了经过特殊训练的神经网络,可从某些类型的图像中提取文本,以最大的准确性:
- 扫描或照片的身份证和护照。
- 车牌车牌。
- 发票。
- 收据。
内置咒语检查器
尽管aspose.ocr for Python通过Java提供了高识别精度,但打印缺陷,污垢或非标准字体可能会导致某些字符或单词被错误地识别。为了进一步改善识别结果,您可以打开拼写检查器,该检查器可以根据所选的识别语言找到并自动纠正拼写错误。
如果公认的文本包含常见拼写字典中不存在的专业术语,缩写和其他单词,则可以提供自己的单词列表。
有效的批处理识别
我们的Python OCR API使您能够简化图像识别。利用多功能批处理处理方法在单个呼叫中有效地处理多个图像:
- 识别多页PDF,TIFF文件。
- 处理文件夹中的所有文件。
- 处理存档中所有文件的识别。
- 从指定列表中识别图像。
通过python示例学习
探索各种[python示例](https://products.aspose.com/ocr/python-java/conversion/)旨在帮助您迅速掌握OCR解决方案的功能和功能。快速洞悉创建满足您特定业务需求的自定义解决方案。
功能和功能
Aspose.OCR for Python via Java 探索aspose.ocr的高级功能
照片OCR
从智能手机照片中提取文字,具有扫描级别的精度。
可搜索的PDF
将任何扫描转换为完全可搜索且可索引的文档。
URL识别
识别来自URL的图像而无需在本地下载。
散装认可
阅读来自多页文档,文件夹和档案的所有图像。
任何字体和样式
识别并识别所有流行字体和样式中的文本。
微调识别
调整每个OCR参数以获得最佳识别结果。
拼写检查器
通过自动纠正拼写错误的单词来改善结果。
在图像中找到文字
在一组图像中搜索文本或正则表达式。
比较图像文本
无论情况和布局如何,都比较两个图像上的文本。
Python代码样本
发现代码示例以通过Java无缝将python的aspose.ocr集成到您的应用中。
轻松安装
作为Python软件包或具有最小依赖性的可下载文件,Aspose.ocr for Python通过Java确保了简单的分发。将其直接从Python集成到您的项目中,并且您准备好利用完整的OCR功能,以节省识别的各种格式。
后安装后,迅速开始使用Aspose.ocr。临时许可将删除30天的所有试用版本限制。利用这一时期来启动功能齐全的OCR应用程序的开发,使您可以通过Java稍后通过Java做出明智的购买aspose.ocr。
加载许可证
lic = License()
lic.set_license(self.licPath)
图像识别
OCR应用程序中的主要挑战是最终用户的扫描仪稀缺。我们的API通过Java与Python无缝集成,具有强大的内置图像预处理过滤器处理旋转,偏斜和嘈杂的图像。结合对所有图像格式的支持,即使在智能手机照片中,它也允许可靠的识别。大多数预处理和图像校正都是自动化的,只需要在具有挑战性的情况下进行干预。
应用自动图像更正-Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python通用转换器
我们的API擅长读取扫描仪,相机或智能手机的任何图像:PDF文档,JPEG,PNG,TIFF,GIF,BMP文件。对多页PDF文档,TIFF和DJVU图像的全面支持可确保多功能性。您还可以通过URL从Web提供图像。
识别结果以流行文档和数据交换格式返回:纯文本,PDF,Microsoft Word,Microsoft Excel,JSON和XML。
识别PDF并将结果保存到各种输出格式-Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
优化资源使用情况
OCR提供了一种特殊的识别算法,用于从具有稀疏文本和嘈杂/彩色背景的图像中提取内容。在以下业务案例中,此方法可显着提高OCR的准确性:
- 从街头照片中阅读文字。
- 细分并确定街道图像中的路标和招牌。
- 找到价格标签,并将提取的文本解释为价格。
- 在食品标签上查找和汇总感兴趣的区域,例如营养信息或成分清单。
- 识别和分析车牌。
- 从菜单和目录中提取文本。
开放区OCR -Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
从街头照片中提取文字
Python的OCR提供了一种特殊的识别算法,该算法从车辆车牌中提取文本,包括黑暗和模糊的照片。然后可以自动保存到数据库或自动验证所得的文本。
识别汽车编号 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)