[发明专利]一种基于残差网络的环境声音识别系统及方法在审
申请号: | 202110628210.5 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113345427A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 刘亚荣;于顼顼;谢晓兰;肖博怀 | 申请(专利权)人: | 桂林理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L21/02;G10L21/0316 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于残差网络的环境声音识别系统及方法,包括:数据输入模块、声音信号增强模块、预处理模块、特征提取模块、训练残差网络模块和模型库模块。本发明采用声音信号增强技术对数据样本作增强处理,凸显了数据样本的特征;预处理将声音样本分割为短时平稳的帧;采用FBank特征提取方法提取声音的深层次特征,并将时域信号转化为频域信号,FBank利用高维度特征的相关性,比梅尔频率倒谱系数更适合神经网络模型的训练;残差网络凭借其特殊的残差块结构可以避免随着网络加深而带来的网络退化、梯度消失和梯度爆炸的问题,从而优化网络模型,提升模型的泛化能力,从而提升环境声音的识别率,和传统的环境声音识别方法相比,有很大的提升。 | ||
搜索关键词: | 一种 基于 网络 环境 声音 识别 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林理工大学,未经桂林理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110628210.5/,转载请声明来源钻瓜专利网。