什么是通用场景文字识别
通用场景文字识别
覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核、快递面单识别等场景
通用场景文字识别的产品都有
1、通用文字识别
基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务
2、办公文档识别
可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容
3、网络图片文字识别
针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果
4、数字识别
识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景
5、手写文字识别
支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
6、表格文字识别
对单据或报表中的表格内容进行结构化识别,并以JSON或Excel形式返回
7、二维码识别
对二维码、条形码中对应的文字内容进行识别,返回存储的文字信息
百度通用文字场景识别特色优势
1、准确率高
针对图片模糊、倾斜、翻转等情况进行专项优化,鲁棒性强,多项ICDAR指标居世界第一,总体识别准确率高达99%
2、服务稳定
依托百度云技术实力,提供高可靠性、弹性可伸缩、高并发承载的云端服务,服务可用性高达99.99%
3、支持多语种识别
通用文字识别支持对中、英、法、俄、西、葡、德、意、日、韩等20个语种的识别,并支持中、英、日、韩4个语种的类型检测