[发明专利]一种声源锁定方法在审
申请号: | 201810153073.2 | 申请日: | 2018-02-22 |
公开(公告)号: | CN108364642A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 陈思应;孙振奎;陈跃华;余杰;何云鹏;高君效 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/16;G10L25/18;G01S11/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音识别领域,特别是涉及到一种声源锁定方法,由声音采集模块采集外部语音数据并传输给语音识别模块进行识别,该方法采用DNN算法来确定出声源与设备的距离,使用该方法的设备能够屏蔽声源以外所发出的声音并可不用将客户的语音数据传输至云端,提高语音识别的准确性并避免泄露客户隐私。 | ||
搜索关键词: | 声源 语音识别 锁定 声音采集模块 语音识别模块 语音数据传输 客户隐私 语音数据 屏蔽 云端 算法 泄露 采集 传输 外部 客户 | ||
【主权项】:
1.一种声源锁定方法,其包括以下步骤:步骤一 语音采集模块采集外部语音数据并发送给语音识别模块;步骤二 所述语音识别模块将所述语音数据进行快速傅立叶变化后得到频谱集;步骤三 将所述频谱集划分成N个子带频谱,N为大于1的正整数;步骤四 用主频分离的方法将所述子带频谱进行频率成分的搜索并归类分组;步骤五 对同一所述语音数据在所述语音采集模块的左通道和右通道的相同频率的所述子带频谱做互相关运算得到互相关函数;步骤六 累加所述互相关函数获取延迟时间并计算出声源与设备之间的距离;步骤七 将所述频谱集输入所述语音识别模块中的语音识别引擎;步骤八 所述语音识别引擎根据所述频谱集内的频谱特征采用DNN(深度神经网络)算法在本地终端对所述频谱集内的频谱进行识别;步骤九 语音识别模块将步骤八的识别结果发送给设备控制电路;步骤十 所述设备控制电路根据所述识别结果控制所述设备执行操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810153073.2/,转载请声明来源钻瓜专利网。