[发明专利]基于小波包分解和声谱图特征的动物声音识别方法在审

专利信息
申请号: 201611058956.2 申请日: 2016-11-27
公开(公告)号: CN106531174A 公开(公告)日: 2017-03-22
发明(设计)人: 李应;黄鸿铿 申请(专利权)人: 福州大学
主分类号: G10L17/26 分类号: G10L17/26;G10L25/18;G10L21/0208
代理公司: 福州元创专利商标代理有限公司35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于小波包分解和声谱图特征的动物声音识别方法,提出了一种基于Bark尺度的小波包分解系数重构的频谱投影结合随机森林的动物声音识别方法。首先,声音信号先经过Bark尺度的小波包分解;然后,生成小波包分解系数重构信号的频谱图;接着,对这些频谱图进行投影并生成BWCSP特征;最后,通过随机森林分类器实现动物声音的识别。对于受背景声音影响严重的动物声音,采用短时谱估计法对声音信号进行增强。本发明所提出的方法,结合短时谱估计法、BWCSP特征和随机森林的方法能够识别各种背景声音下的动物声音,且在‑10dB的情况下,能够保持平均60%以上的识别率。
搜索关键词: 基于 波包 分解 声谱 特征 动物 声音 识别 方法
【主权项】:
一种基于小波包分解和声谱图特征的动物声音识别方法,其特征在于,按照如下步骤实现:步骤S1:采集声音样本,获取训练样本以及测试样本;步骤S2:对所述训练样本以及所述测试样本进行声音增强;步骤S3:将增强后声音信号进行Bark尺度的小波包分解;步骤S4:重构小波包分解系数,并把重构后的信号通过短时傅里叶变换生成重构信号频谱;步骤S5:将所述重构信号频谱进行主成分分析,提取投影特征,获取各个Bark频率群的BWCSP;步骤S6:采用随机森林识别各个Bark频率群的BWCSP。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611058956.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top