[发明专利]基于声信号语谱图纹理分布的声特征提取方法有效
申请号: | 201810385668.0 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108847252B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 曹九稳;裴雷雨 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/27;G10L25/03;G10L25/18;G10L25/24;G10L25/45 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 信号 语谱图 纹理 分布 特征 提取 方法 | ||
本发明公开了一种基于声信号语谱图纹理分布的声特征提取方法。本发明包括如下步骤:步骤1:将采集到的声音信号预处理。步骤2:将增强的声音信号以语谱图的形式输出。步骤3:将彩色语谱图转换成灰度图。步骤4:将灰度图二值化处理,转换成对应的二值图。步骤5:根据转换后的二值图纹理分布特征提取相应特征数据。步骤6:通过分类器对提取到的声信号进行训练建模分类。本发明对于远距离声信号,通过本方法提取的特征其识别率有所提高。在复杂噪音环境下通过本方法提取到的声特征能有效的与噪音信号区分开。
技术领域
本发明属于信号处理的技术领域,涉及一种基于声信号语谱图纹理分布的声特征提取方法。
背景技术
传统的对声信号特征提取的方法有LPCC(线性预测倒谱系数)和MFCC(梅尔倒谱系数)等。
LPCC是基于线性预测分析(LPC)的方法求取声音信号的特征参数,基本思想为,通过声音信号在某个时间点之前的P个样本预测此点的声音样本,并且可以由这P个样本的线性组合表示。由工程器械声音信号的LPCC特征图(1)可以看到,不同器械信号的分布各有特点,但仅从第一个系数来看,这几类器械的参数都有重合,没有表现出对特征信号很好的区分性。
MFCC是基于人耳对声音的感知模型特性提出的,人的听觉对声音的感知能力与其频率呈非线性关系,对不同频率声音的灵敏程度不同,总体上对低频有更好的分辨能力。从声音信号的MFCC特征分布图上可以看出不同器械特征分布整体上有所区别,由工程器械声音信号的MFCC特征分布图(2)中可以看出,第一个系数的取值相互之间差别较大,但存在一定范围的参数重合,如第2、3、5以及高频部分较多的参数。因此使用MFCC特征可以实现基本的描述,但是对特征的区分度不够理想。
发明内容
针对以上传统的声信号特征参数存在的问题,本发明提供了一种基于声信号转换语谱图纹理分布的声特征提取方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:将采集到的声音信号预处理。
步骤2:将增强的声音信号以语谱图的形式输出。
步骤3:将彩色语谱图转换成灰度图。
步骤4:将灰度图二值化处理,转换成对应的二值图。
步骤5:根据转换后的二值图纹理分布特征提取相应特征数据。
步骤6:通过分类器对提取到的声信号进行训练建模分类。
本发明有益效果如下:
对于远距离声信号,通过本方法提取的特征其识别率有所提高。
在复杂噪音环境下通过本方法提取到的声特征能有效的与噪音信号区分开。
附图说明
图1是四种工程器械声音信号的LPCC特征分布图。
图2是四种工程器械声音信号的MFCC特征分布图。
图3是对声信号进行语谱图纹理分布特征提取的步骤流程图。
图4是本发明方法中声信号转换为语谱图的过程示意图。
图5是灰度图二值化示意图。
图6是针对四种工程器械声音信号通过本发明方法得到的二值图。
图7、图8、图9是以实际工程器械声音信号为例的二值图纹理特
征分布图描述。
具体实施方式
下面结合附图和具体实现方法对本发明作详细的说明,并采用实际工程器械所产生声音信号为例,描述该特征提取算法,此描述仅作为示范和解释,并不对本发明方法作任何形式上的限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810385668.0/2.html,转载请声明来源钻瓜专利网。