[发明专利]面向安防领域的无监督的新颖性音频事件检测方法及系统有效
申请号: | 201610647449.6 | 申请日: | 2016-08-09 |
公开(公告)号: | CN106251860B | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 张爱英;倪崇嘉 | 申请(专利权)人: | 张爱英;倪崇嘉 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/10;G10L15/20;G10L25/30 |
代理公司: | 37221 济南圣达知识产权代理有限公司 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了面向安防领域的无监督的新颖性音频事件检测方法及系统;模型训练步骤:对实际监控场景下的音频进行训练,训练得到基于深度双向长短时记忆递归神经网络的降噪自动编码机模型;颖性音频事件检测步骤:对获取在实际监控场景下不同待测区域的音频,对音频进行特征提取后,将提取后的特征输入到已经训练得到的基于深度双向长短时记忆递归神经网络的降噪自动编码机模型中,进行新颖性音频事件发生与否的检测。本发明利用基于深度双向长短时记忆递归神经网络的降噪自动编码机编码实际场景中有用的信息。该信息能够使得系统有效的检测出实际场景下新颖性事件。 | ||
搜索关键词: | 面向 领域 监督 新颖性 音频 事件 检测 方法 系统 | ||
【主权项】:
1.面向安防领域的无监督的新颖性音频事件检测方法,其特征是,包括如下步骤:/n模型训练步骤:对实际监控场景下的音频进行训练,训练得到基于深度双向长短时记忆递归神经网络的降噪自动编码机模型;/n新颖性音频事件检测步骤:对获取在实际监控场景下不同待测区域的音频,对音频进行特征提取后,将提取后的特征输入到已经训练得到的基于深度双向长短时记忆递归神经网络的降噪自动编码机模型中,进行新颖性音频事件发生与否的检测;/n所述新颖性音频事件检测步骤包括如下步骤:/n步骤(2-1):获取实际应用场景下音频,并对获得的音频提取听觉谱特征,然后转入步骤(2-2);/n步骤(2-2):将步骤(2-1)提取的特征输入到模型训练步骤得到的基于深度双向长短时记忆递归神经网络的降噪自动编码机模型中,获得自动编码机模型的输出;然后转入步骤(2-3);/n步骤(2-3):计算在步骤(2-2)中输入自动编码机模型的音频特征和步骤(2-2)中自动编码机模型输出之间误差;然后转入步骤(2-4);/n步骤(2-4):在设定时间段内连续的音频上,积累步骤(2-3)获得的误差,并根据积累的误差数据,计算阈值;当误差大于阈值时,则认为新颖性音频事件发生;否则,认为新颖性音频事件不发生。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张爱英;倪崇嘉,未经张爱英;倪崇嘉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610647449.6/,转载请声明来源钻瓜专利网。
- 上一篇:语音识别处理方法和装置
- 下一篇:一种基于场景建模的公共场所异常声音检测方法