[发明专利]一种基于卷积神经网络CNN的声源定位方法有效
| 申请号: | 201710731343.9 | 申请日: | 2017-08-23 |
| 公开(公告)号: | CN107703486B | 公开(公告)日: | 2021-03-23 |
| 发明(设计)人: | 万新旺;王吉;廖鹏程;陈中倩 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G01S5/18 | 分类号: | G01S5/18;G06N3/04 |
| 代理公司: | 南京知识律师事务所 32207 | 代理人: | 高娇阳 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 cnn 声源 定位 方法 | ||
本发明提供了一种基于卷积神经网络CNN的声源定位算法。该方法通过引入鉴别互相关函数的特征,利用Roomsim的仿真环境以及两个麦克风所接收的信号,得到在带有混响和噪声环境下的互相关函数,并分帧截取得到训练集和测试集,对该特征进行训练得到卷积神经网络,即CNN模型,训练过程中,采用ReLU函数作为激活函数,并将测试集在该模型下进行声源定位估计,最后采用贝叶斯决策来构建判决式决定测试样本的类别,使得条件概率p(rs|Y)最大的位置即为估计出声源的真实位置。这种算法的实现,有效地解决了传统声源定位中噪声和混响的问题。
技术领域
本发明涉及一种基于神经网络CNN的声源定位方法研究,属于信息技术领域。
背景技术
对于声源定位算法来说,如何提高抗噪声和抗混响能力是长久以来的研究重心,在实际的环境下,当信噪比很小、混响严重的情况下,基于传统算法的改进措施很难有明显的效果。此外当麦克风无法接收到声源的直达声时,也难以定位。本发明提出使用卷积神经网络CNN鉴别相位变换加权广义互相关函数(GCC-PHAT)来进行声源定位。实验表明,卷积神经网络CNN在低信噪比和严重混响环境下有更出色的定位性能。
卷积神经网络CNN是一种前馈神经网络,是受生物学上感受野的机制而提出的,CNN以其局部连接,局部权值共享的结构特性在语音识别和图像处理方面有着独特的优越性。其思想是CNN由一组或多组卷积层和采样层构成,一个卷积层中包含若干个不同的卷积器,这些卷积器对语音的各个局部特征进行观察。采样层通过对卷积层的输出结点做固定窗长的采样,减少下一层的输入结点数,从而控制模型的复杂度。一般采样层采用最大采样算法,即对固定窗长内的结点选取最大值进行输出。
对于一维卷积神经网络,在采用卷积来代替全连接的卷积神经网络中,第l层的每一个神经元都只和l-1层的一个局部窗口内的神经元相连,构成一个局部连接网络。第l层的第i个神经元的输入定义为:
上述公式也可以写为:
其中,f(x)为激活函数,本发明激活函数采用ReLU函数,为l-1层神经元输出的加权偏置,为m维的滤波器,为其权值,为神经元输入,b(l)为偏置,的下标从1开始,表示卷积运算。
从公式(1.2)可以看出,w(l)对于所有的神经元都是相同的。这也是卷积层的权值共享特性。在卷积层里,我们只需要m+1个参数。
此外,在互相关函数特征的选取中,本发明利用Roomsim工具包模拟出在带有混响和噪声的室内环境,通过两个不同位置的麦克风接收信号x1(t)和x2(t)之间的广义互相关函数(GCC)可以在频域计算:
式中,上标“*”表示复共轭,X1(ω)、X2(ω)分别是x1(t)、x2(t)的傅里叶变换,Ψ1,2(ω)为加权函数。
为了增强互相关函数的抗混响能力,可以使用相位变化(PHAT)加权函数:
将式(1.4)代入式(1.3),得到:
在实际情况中,麦克风接收信号x1(t)和x2(t)经过加窗后,再由傅里叶变换求得X1(ω)和X2(ω)。如果房间脉冲响应的长度L比窗函数的长度短很多,则麦克风接收信号在频域可以表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710731343.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:医用冰垫(痔疮冷敷型)
- 下一篇:医用冰垫(会阴冷敷型)





