远场语音识别
通过麦克风阵列前端处理算法,甚至可以在三五米范围内远程语音也可以被准确识别
功能介绍
百度语音为开发者提供高质量的远场语音识别服务。通过麦克风阵列的前端处理算法,有效地消除了噪声,增强了目标说话人的语音,使智能家居、智能硬件、机器人语音交互等场景中的远场语音都能得到准确识别
应用场景
机器人语音交互
提出了麦克风阵列的前端算法,解决了人机交互中由于距离太远造成的识别率低的问题,使人机对话更加方便
主要服务:远场语音识别语音合成语音唤醒
智能家居
通过远场语音识别技术,用户甚至可以在3到5米的距离内操作智能家居语音
主要服务:远场语音识别语音合成语音唤醒
技术特点
1支持多个麦克风阵列
它可以支持单通道远场、均匀线性远场和均匀环形阵列远场的识别和唤醒
2麦克风阵列波束形成
利用麦克风阵列的空间选择性,增强目标说话人的语音,抑制或消除噪声、混响等无效语音干扰
三。语音增强
有效消除环境噪声,提高输入信号质量