[发明专利]一种基于深度变换特征的高速公路异常音频事件分类方法在审
申请号: | 201711305135.9 | 申请日: | 2017-12-11 |
公开(公告)号: | CN108182949A | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 李艳雄;李先苦;张聿晗 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/24;G10L25/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度变换特征的高速公路异常音频事件分类方法,首先采集高速公路异常音频事件样本,然后划分为训练集和测试集;接着分别对训练集和测试集音频事件样本进行预加重、分帧、加窗处理,且取前后2帧构成上下文音频数据块;从上述音频数据块中提取声学特征拼接成特征矢量;将特征矢量输入深度自编码网络提取深度变换特征;然后输入长短时记忆网络分类器,辨识各类异常音频事件。上述深度自编码网络特征提取器与长短时记忆网络分类器都包括训练步骤和测试步骤。本发明采用的深度变换特征是各传统声学特征的融合与变换,具有更好的区分性和鲁棒性,在对高速公路复杂音频中的异常音频事件进行分类时能取得更佳的分类效果。 | ||
搜索关键词: | 音频事件 深度变换 高速公路 音频数据块 记忆网络 声学特征 特征矢量 测试集 分类器 训练集 自编码 分类 样本 测试步骤 分类效果 加窗处理 网络特征 网络提取 训练步骤 鲁棒性 区分性 提取器 预加重 辨识 分帧 拼接 采集 融合 | ||
【主权项】:
1.一种基于深度变换特征的高速公路异常音频事件分类方法,其特征在于,所述的方法包括下列步骤:S1、数据准备,利用录音设备在高速公路采集包含异常音频事件的音频数据并进行人工标注,然后将上述音频数据划分为训练数据集和测试数据集;S2、预处理,分别对训练数据和测试数据进行预加重、分帧、加窗,取前后2帧组成上下文音频数据块;S3、声学特征提取,对预处理后的音频数据做声学特征提取,包括梅尔滤波器组、Gabor滤波器组和常Q倒谱系数,并将上述三种特征拼接成一个声学特征矢量;S4、深度变换特征提取,构建深度自编码网络,将上述声学特征矢量输入深度自编码网络,基于最小误差准则确定深度自编码网络参数,深度自编码网络输出层的输出是对输入层的输入声学特征矢量的重构,深度自编码网络瓶颈层的输出即为深度变换特征;S5、异常音频事件分类,将上述深度变换特征输入已经训练好的长短时记忆网络分类器,得到异常音频事件的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711305135.9/,转载请声明来源钻瓜专利网。