[发明专利]一种复杂环境下声源定位跟踪方法在审
申请号: | 201610024997.3 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106970356A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G01S5/22 | 分类号: | G01S5/22;G10L15/22;G10L21/0224;G10L21/0232 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 环境 声源 定位 跟踪 方法 | ||
1.一种复杂环境下声源定位跟踪方法,其特征在于,应用于智能设备,具体步骤如下:
步骤S1:通过一麦克风阵列捕获语音信号,建立第n个麦克风在时刻k接收到的语音信号的声学模型为:
yn(k)=gn*s(k)+vn(k),n=1,2,3,…,N;
其中,gn是从声源到第n个麦克风的信道冲激响应;
s(k)为未知信号源;
vn(k)为第n个麦克风接收到的加性噪声信号,并假设与目标语音信号及其他噪声不相关;
N为麦克风阵列的麦克风数目;
步骤S2:自所述语音信号的功率谱中减去所述加性噪声信号的功率谱,对获得的功率谱进行傅里叶反变换,得到预处理后的语音信号;
步骤S3,自所述麦克风阵列中选取一路麦克风作为参考麦克风,计算所述未知信号源的信号到达所述麦克风阵列中不同麦克风的波达时延;
步骤S4:利用所述波达时延信息和所述麦克风阵列的拓扑结构信息估计声源的位置;
步骤S5,调整所述智能设备以朝向所述声源的位置。
2.根据权利要求1所述的复杂环境下声源定位跟踪方法,其特征在于,所述步骤S2包括:
步骤S21,通过一带通滤波器组对所述语音信号进行预滤波获得预滤波后的语音信号;
步骤S22,对所述预滤波后的语音信号进行加窗和分帧操作,获得复数段的帧数据;
步骤S23,对复数段的所述帧数据进行小波变换,并计算小波变换后的语音数据的方差;
步骤S24,判断一帧数据的语音数据的方差是否大于一端点检测门限值,如果大于,则相应的所述帧数据之后的语音数据为有效的语音数据,当前帧数据记为起始帧;
步骤S25,判断所述起始帧之后的一帧数据的语音数据的方差小于所述门限值时,对应的帧数据记为结束帧。
3.根据权利要求2所述的复杂环境下声源定位跟踪方法,其特征在于,所述步骤S2包括:
步骤S26,对确定了起始帧和结束帧的分帧操作后的语音信号进行时域到频域的转换,并计算转换后的频域信号的功率谱;
步骤S27,自所述语音信号的功率谱中减去所述加性噪声信号的功率谱,
步骤S28,进行傅里叶反变换得到预处理后的语音信号。
4.根据权利要求2所述的复杂环境下声源定位跟踪方法,其特征在于,所述步骤S21中所述带通滤波器组的上限截止频率为3400Hz,下限截止频率为200Hz,采样率大于20KHz。
5.根据权利要求1所述的复杂环境下声源定位跟踪方法,其特征在于,所述步骤S3具体包括:
步骤S31,利用加权广义互相关法分别计算各个预处理的语音信号的加权互功率谱;
步骤S32,分别对各个所述互功率谱进行傅里叶反变换,得到广义互相关函数;
步骤S33,分别获取使得所述广义互相关函数最大的时间值作为所述未知信号源到达各个麦克风的相对时延。
6.根据权利要求1所述的复杂环境下声源定位跟踪方法,其特征在于,所述步骤S4具体包括:
步骤S41,利用所述相对时延值计算出声源到达各个麦克风的距离差;
步骤S42,结合所述麦克风阵列的拓扑结构信息确定声源的位置。
7.根据权利要求1所述的复杂环境下声源定位跟踪方法,其特征在于,所述麦克风阵列沿圆形拓扑结构设置于所述智能设备上,每个麦克风距离所述麦克风阵列的中心点的距离为8mm至10mm。
8.根据权利要求1所述的复杂环境下声源定位跟踪方法,其特征在于,所述智能设备采用家用服务机器人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610024997.3/1.html,转载请声明来源钻瓜专利网。