它提供业界非常划算的语音识别服务,具有超高的识别精度,适合多种场景
语音识别中的ASR介绍
腾讯云语音识别(ASR)为企业提供高性价比的语音识别服务。它被大量的内部业务使用,如微信、金光、腾讯视频等,以及许多其他场景,如外部登陆录制和质量检测、实时会议转录、语音输入法等。
产品子功能
1、实时语音识别
可用于智能语音助手等实时音频流场景。
2、录音文件识别
可应用于呼叫中心语音质量检测、视频字幕生成、会议语音数据转录等场景。
3、一句话识别
它能在一分钟内识别出短音频文件,可应用于语音输入法、语音信息到文本、语音搜索等场景。
4、语音流的异步识别
它能够对直播协议语音流进行识别,准实时返回识别结果,支持特殊的音视频场景模型,可用于直播流质量检测等场景。
5、音频文件识别速度版
可应用于音视频字幕、准实时质量检测分析场景等场景。
产品优势
1价格很低
购买预付费套餐更优惠,1小时语音识别不到1元。每月提供免费配额,最大限度地降低客户成本。
2效果不错
文字准确率达97%,处于行业领先水平,与微信、王者荣耀的语音短信服务不相上下。
三。多种语言
它已经支持普通话、英语、广东话、韩语、日语、泰语和上海方言的语音识别,并将在未来开放其他语言和方言的识别能力。
4强大的算法
基于创新的网络结构tlc-blstm,通过注意机制对语音信号进行有效建模,并通过师生方法提高系统的鲁棒性,对一般场景和垂直场景具有业界领先的识别精度和效率。
5自助提高准确性
针对垂直领域,可以通过上传词汇或句子来完成语言模型的自动优化。借助于自学习平台,在不了解算法的情况下,很容易实现自定义模型,进一步提高了识别精度。
6丰富的支持方案
通过对内部微信、腾讯视频、王者荣耀等大流量产品的充分验证,在互联网、金融、教育等领域,基于海量数据实现场景优化,积累了多行业的最佳实践。
应用场景
1、呼叫中心录音质量检查
业务难点
传统的质量检测方法受到人们工作效率和人工成本的严重限制,难以对客户服务的实际工作质量进行评价。
解决方案
语音识别将电话录音识别为文本,然后通过质量检测规则对文本进行分析,识别出不符合规范的业务通话记录。
价值提升
大大提高呼叫中心的质量控制能力,完成人力无法完成的超大规模电话录音质检工作,提高呼叫中心人员的服务质量。
2、短视频字幕
业务难点
在拍摄视频日志的场景中,用户在拍摄视频的同时会说话;在拍摄完视频后,用户需要重新编辑,并手动输入字幕发布视频。
解决方案
通过录音文件识别速成版,用户可以同时拍摄和说话,语音内容直接显示在视频上。
价值提升
它大大降低了用户后期处理的成本,让用户拍摄后可以发布。
3、视频理解
业务难点
在直播、音频分享等平台上,有大量的音视频需要了解,进行质量检测或标签推荐,依靠人力资源难以实现。
解决方案
音频文件识别/语音流异步识别/音频文件识别速成版可以通过音视频互斥模式将音频(流)转录到视频中,满足多输入、不同延迟的需求。
价值提升
有助于快速了解平台上海量的音视频,大大降低人工成本,快速实现质检审核或准确推荐。