[发明专利]语音唤醒方法、系统、装置和设备在审
申请号: | 202310371045.9 | 申请日: | 2023-04-07 |
公开(公告)号: | CN116386643A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 刘本钰;李玉东;刘涛 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/22 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 唤醒 方法 系统 装置 设备 | ||
1.一种语音唤醒系统,其特征在于,所述系统包括特征提取模块、人声识别模块和语音唤醒模块,其中:
所述特征提取模块用于对待识别音频数据进行特征提取,得到所述待识别音频数据的音频特征;
所述人声识别模块用于获取所述待识别音频数据的音频特征,并基于所述待识别音频数据的音频特征,确定所述待识别音频数据是否包含人声,以及在所述待识别音频数据包含人声时,将所述待识别音频数据输入至所述语音唤醒模块;
所述语音唤醒模块用于在所述待识别音频数据包含人声时对中央处理器CPU上电,以通过部署在CPU中的关键词识别模型唤醒语音交互应用。
2.如权利要求1所述的系统,其特征在于,所述系统还包括数据存储模块,所述数据存储模块包括静态存储模块,所述静态存储模块用于存储所述特征提取模块和所述人声识别模块的计算参数,以及所述特征提取模块提取的所述待识别音频数据的音频特征;
所述特征提取模块,还用于将所述待识别音频数据的音频特征写入至所述静态存储模块;
所述人声识别模块,还用于从所述静态存储模块中读取所述待识别音频数据的音频特征。
3.如权利要求2所述的系统,其特征在于,所述人声识别模块包括交互接口、数据预取模块、数据分发模块和神经网络计算模块,其中:
所述交互接口用于从所述静态存储模块中读取所述待识别音频数据的音频特征;
所述数据预取模块用于从所述数据存储模块中读取所述人声识别模块的计算参数;
所述数据分发模块用于将所述人声识别模块中的多种类型的计算参数分发至多个寄存器中,其中,一种类型的计算参数对应于一个寄存器;
所述神经网络计算模块用于基于分发至所述多个寄存器中的计算参数、以及所述待识别音频数据的音频特征,确定所述待识别音频数据是否包含人声。
4.如权利要求3所述的系统,其特征在于,所述数据存储模块还包括寄存器,所述寄存器用于存储所述人声识别模块的计算参数的首地址,所述数据预取模块,具体用于:
从所述寄存器中读取所述人声识别模块的计算参数的首地址;
基于所述人声识别模块的计算参数的首地址以及人声识别模块的计算参数的优先级,从所述静态存储模块中读取所述人声识别模块的计算参数。
5.如权利要求3所述的系统,其特征在于,所述人声识别模块中的多种类型的计算参数包括偏置参数、剩余组数、移位参数、剩余组数的首地址和权重参数,所述数据分发模块将所述人声识别模块中的多种类型的计算参数分发至多个寄存器中时,具体用于:
将所述偏置参数、所述剩余组数和所述移位参数分别分发至偏置参数寄存器、剩余组数寄存器和移位参数寄存器;
将所述剩余组数的首地址分发至剩余组数的首地址寄存器;
将所述权重参数分发至权重参数寄存器,其中,所述权重参数寄存器包括第一权重参数寄存器和第二权重参数寄存器,将所述权重参数分发至权重参数寄存器包括:从所述第一权重参数寄存器和所述第二权重参数寄存器中确定数据被读取完毕的目标寄存器,将所述权重参数分发至所述目标寄存器。
6.如权利要求5所述的系统,其特征在于,所述神经网络计算模块部署有人声识别模型,所述人声识别模型由多层网络构成,一层所述网络有多个网络节点,所述神经网络计算模块,具体用于:
从所述多个寄存器中分别读取偏置参数、剩余组数、移位参数、剩余组数的首地址和权重参数;
基于所述待识别音频数据的音频特征、所述偏置参数、所述移位参数和所述权重参数,确定所述人声识别模型中各网络节点的输出数据;
对所述人声识别模型中最后一层网络中各网络节点的输出数据进行归一化处理,得到所述归一化后的输出数据;
基于所述归一化处理后的输出数据和预设阈值,确定所述待识别音频数据是否包含人声。
7.如权利要求1~6中任一所述的系统,其特征在于,所述人声识别模块部署有基于稀疏神经网络、多个训练样本数据、以及多个所述训练样本数据对应的标签训练得到的人声识别模型,其中,多个所述训练样本数据包括人声数据和非人声数据,多个所述训练样本数据对应的标签包括人声和非人声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310371045.9/1.html,转载请声明来源钻瓜专利网。