通用OCR简介
通用光学文字识别,基于行业先进的深度学习技术,OCR提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持文本的智能识别将图片上的内容转化为可编辑文本,可以应用于各种场景,如随机扫描、电子纸质文档、电子商务广告审核等,大大提高了信息处理效率。
通用文字识别的特点
1、综合能力
支持识别中文、英文、日文、韩文、西班牙文、法文、德文等语言,以及阿拉伯数字和常用符号,并不断更新迭代模型,扩大支持范围。
2、高精度
它支持图片中文本的自动定位和识别。印刷体的整体识别准确率在95%以上,手写体的整体识别准确率在90%以上,保证了99.5%以上的可用性。
3、鲁棒性强
它支持多场景、任意布局、任意背景,能容忍复杂场景中的透视失真和光照不均匀,并能实现自动修剪和倾斜校正。
应用场景
1、使用通用文字识别技术,可以帮助您完成大量的文档整理工作,从书籍、论文、档案、PPT课件等印刷品,到课堂笔记、作业作文等手写内容,都可以通过拍照实现自动字符识别,方便用户输入文本和文档管理,提高产品可用性和用户体验。
2、识别图像中的不良词语,如社交和电子商务应用中的不文明内容、宣传资料中的广告语言、视频中的广告、标题和字幕等,提示相应的风险,协助用户进行审计处理,帮助用户有效规避业务风险。
3、支持快速识别路标、路标、广告牌、街边店铺招牌、商品包装、购物券等生活场景中的真实文本信息,应用于地图、翻译、搜索、生活出行等移动应用中,方便用户提取或录入文本,有效地提高了识别率提高产品可用性和用户体验。