[发明专利]一种基于卷积神经网络的汽车鸣笛识别方法在审
| 申请号: | 201910378725.7 | 申请日: | 2019-05-08 |
| 公开(公告)号: | CN110136745A | 公开(公告)日: | 2019-08-16 |
| 发明(设计)人: | 陈建峰;白吉生;项彬 | 申请(专利权)人: | 西北工业大学;西安联丰迅声信息科技有限责任公司 |
| 主分类号: | G10L25/30 | 分类号: | G10L25/30;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 顾潮琪 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积神经网络 鸣笛 声谱图 训练集 验证集 短时傅里叶变换 矩阵 汽车 环境背景噪声 人工智能技术 智能交通领域 参数调整 判别结果 传感器 采集 马路 应用 | ||
本发明提供了一种基于卷积神经网络的汽车鸣笛识别方法,通过空气声呐传感器接收空气中的声音信号,采集大量汽车鸣笛声音和环境背景噪声,通过短时傅里叶变换产生声音信号的声谱图,将变换后的声谱图矩阵分为训练集和验证集输入卷积神经网络进行训练,结合卷积神经网络参数调整,使得基于训练集和验证集的效果达到最佳。最终将待识别声音输入卷积神经网络给出判别结果。本发明将人工智能技术应用在了智能交通领域,能够准确识别马路上的鸣笛声音。
技术领域
本发明属于信号处理领域,涉及神经网络、声信号处理识别等理论。
背景技术
通过云、大数据和人工智能方法来提升城市舒适度与便捷度,推动城市建设,智慧城市成为当今世界城市发展不可逆转的历史潮流。智慧城市建设过程中,治理机动车乱鸣喇叭是十分重要的一环,违法鸣笛不仅影响了道路周围市民的正常生活,也为文明城市建设制造了不和谐的噪声。各地交警部门投入了大量精力来整治汽车违法鸣笛问题,但治理效果差强人意。究其原因是由于交警部门查处违法鸣笛的方式主要是人工辨别,在嘈杂的马路上人工辨别的难度较大,采样取证更为困难,加大了交警的执法难度,很难取得理想的效果。
传统的声音识别算法一般有动态时间规整技术、支持向量机、高斯混合模型以及隐马尔可夫模型等。但是这些识别模型都只是一种符号化系统,降低了建模的能力,因此在实际环境中对不同质量的声音信号的识别性能将会大幅下降。人工神经网络是20世纪80年代以来人工智能领域兴起的研究热点。随着人工神经网络的研究工作不断深入,目前已经取得了很大的进展。将神经网络应用于声音信号的处理,可以解决高维空间和非线性模式等方面的识别问题,适用于对多个信号、特征量维数多的复杂声音的识别。近年来大规模标记数据的出现和GPU计算性能的快速提高使得卷积神经网络在实际环境中应用成为可能。
发明内容
为了克服现有技术的不足,本发明提供一种基于卷积神经网络的汽车鸣笛识别方法,通过空气声呐传感器接收空气中的声音信号,采集大量汽车鸣笛声音和环境背景噪声,通过短时傅里叶变换产生声音信号的声谱图,将变换后的声谱图矩阵分为训练集和验证集输入卷积神经网络进行训练,结合卷积神经网络参数调整,使得基于训练集和验证集的效果达到最佳。最终将待识别声音输入卷积神经网络给出判别结果。
本发明解决其技术问题所采用的技术方案包括以下步骤:
第一步,采用空气声呐传感器接收多径环境下的声源信号;
第二步,对采集到的声源信号进行高通滤波;
第三步,对高通滤波后的信号进行短时傅里叶变换;
第四步,将第三步处理后得到的数据划分为训练集、验证集和测试集;
第五步,构建卷积神经网络并进行训练优化;
第六步,将测试集中的数据输入优化后的卷积神经网络,得到识别结果。
所述的第二步采用巴特沃斯滤波器对采集到的声源信号进行高通滤波。
所述的第三步采用汉宁窗进行信号截取,对高通滤波后的信号进行短时傅里叶变换。
所述的第四步采用的划分方法包括留出法、交叉验证法和自助法。
所述的第五步,构建卷积神经网络并对超参数进行训练优化,所述的超参数包括学习率、批次大小、迭代次数、卷积核尺寸、步长和激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;西安联丰迅声信息科技有限责任公司,未经西北工业大学;西安联丰迅声信息科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910378725.7/2.html,转载请声明来源钻瓜专利网。





