[发明专利]基于机器学习的鸣笛识别方法在审
申请号: | 201910038606.7 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109584888A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 乔天昊;徐树公;张舜卿;曹姗 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/04;G10L17/02;G10L25/45 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 鸣笛 分类器 基于机器 数据混合 样本数据 数据集 在线阶段 耗时 学习 分类 | ||
一种基于机器学习的鸣笛识别方法,以公开数据集和鸣笛数据混合生成样本数据,通过提取其MFCC特征对分类器进行训练,并在在线阶段将训练后的分类器用于对待测数据进行分类,实现鸣笛识别,其中:分类器采用开源轻量级梯度Boosting框架实现;样本数据通过将公开数据集ESC‑50中非鸣笛数据与鸣笛数据混合得到。本发明与现有技术相比具有耗时短且更加准确的识别效果。
技术领域
本发明涉及的是一种环境声音识别领域的技术,具体是一种基于机器学习的鸣笛识别方 法。
背景技术
车辆鸣笛声作为环境声中的一部分,对其的识别本身就可作为环境声研究的一部分。在 高科技时代下应运而生的违法鸣笛抓拍系统中,既要准确迅速识别出鸣笛声以供摄像头及时抓 拍,又要排除环境中其他声音的干扰以防误判,因此,对于鸣笛声音的识别要求很高。
现有的复杂噪声环境下的鸣笛识别方法,先利用麦克风获取原始训练样本库并选出训练 样本集,而后利用HMM模型进行训练得到模型库,最后利用模型对测试样本进行分类识别得 到最终识别结果。在此技术中可利用较少的人工标注获得高质量的训练数据集,从而解决列车 声音本身复杂性带来的训练样本选择的困难,进而提高识别正确率。但这类技术采用的样本一 般为非公开数据集,且算法的复杂度较高、所需时间较长。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于机器学习的鸣笛识别方法,利用机 器学习算法(lightGBM)对其进行识别,与现有技术相比具有更加准确的识别效果,解决了现有 测试方法将非鸣笛数据判断错误的情况。
本发明是通过以下技术方案实现的:
本发明以公开数据集和鸣笛数据混合生成样本数据,通过提取其MFCC特征对分类器进 行训练,并在在线阶段将训练后的分类器用于对待测数据进行分类,实现鸣笛识别。
所述的分类器采用开源轻量级梯度Boosting框架(LightGBM)实现。
所述的样本数据,通过将公开数据集ESC-50中非鸣笛数据与鸣笛数据混合,其中包含 11636鸣笛数据和6359非鸣笛数据。
所述的提取是指:对样本数据进行傅里叶变换,再经过对数运算后再进行傅里叶反变换, 得到梅尔倒谱以获取声音频谱的包络信息,其包含声音的共振峰信息,同时也对应着信号的低 频部分,它是辨别声音的重要信息。因此进行倒谱分析具有十分重要的意义。
所述的提取,具体包括:分帧、加窗、离散傅里叶变换、梅尔频率转换、log非线性变换和离散余弦变换,其中:采样率22050,返回的MFCC数量为20。
所述的训练是指:基于决策树算法,首先使用回归树进行识别,而后通过迭代地添加树 以使得新树可以关注于先前所有树集合的错误分类,将多个树的预测组合以优化目标函数,并 且通过梯度下降来调整添加的树的参数。
所述的目标函数采用logloss(对数损失)。
所述的对待测数据进行分类是指:将待测数据的MFCC特征输入训练后的分类器并得到 预测结果,当预测结果大于0.5则判为鸣笛否则为非鸣笛。
技术效果
与现有技术相比,本发明采用了公开数据集中的环境声作为非鸣笛数据来补充真实街道 环境下录制的环境声数据集,使得鸣笛与非鸣笛数据分布均衡,进而提高非鸣笛数据的识别率, 从而达到提高性能的效果。本发明采用将lightGBM的方法与现有技术相比性能更佳,即可得到 更好的识别效果,且训练耗时更短。
附图说明
图1为本发明基于机器学习的鸣笛识别的流程图;
图2为梅尔频率与赫兹的关系示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910038606.7/2.html,转载请声明来源钻瓜专利网。