[发明专利]基于小波包分解和声谱图特征的动物声音识别方法在审

申请号：	201611058956.2	申请日：	2016-11-27
公开（公告）号：	CN106531174A	公开（公告）日：	2017-03-22
发明（设计）人：	李应;黄鸿铿	申请（专利权）人：	福州大学
主分类号：	G10L17/26	分类号：	G10L17/26;G10L25/18;G10L21/0208
代理公司：	福州元创专利商标代理有限公司35100	代理人：	蔡学俊
地址：	350108 福建省福州市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于小波包分解和声谱图特征的动物声音识别方法，提出了一种基于Bark尺度的小波包分解系数重构的频谱投影结合随机森林的动物声音识别方法。首先，声音信号先经过Bark尺度的小波包分解；然后，生成小波包分解系数重构信号的频谱图；接着，对这些频谱图进行投影并生成BWCSP特征；最后，通过随机森林分类器实现动物声音的识别。对于受背景声音影响严重的动物声音，采用短时谱估计法对声音信号进行增强。本发明所提出的方法，结合短时谱估计法、BWCSP特征和随机森林的方法能够识别各种背景声音下的动物声音，且在‑10dB的情况下，能够保持平均60%以上的识别率。
搜索关键词：	基于波包分解声谱特征动物声音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于小波包分解和声谱图特征的动物声音识别方法，其特征在于，按照如下步骤实现：步骤S1：采集声音样本，获取训练样本以及测试样本；步骤S2：对所述训练样本以及所述测试样本进行声音增强；步骤S3：将增强后声音信号进行Bark尺度的小波包分解；步骤S4：重构小波包分解系数，并把重构后的信号通过短时傅里叶变换生成重构信号频谱；步骤S5：将所述重构信号频谱进行主成分分析，提取投影特征，获取各个Bark频率群的BWCSP；步骤S6：采用随机森林识别各个Bark频率群的BWCSP。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于福州大学，未经福州大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611058956.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于小波包分解和声谱图特征的动物声音识别方法在审

专利文献下载