[发明专利]噪音信号的识别方法及装置在审
申请号: | 201611000609.4 | 申请日: | 2016-11-14 |
公开(公告)号: | CN108073856A | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 薛希俊;王明;闫正 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪音信号 传统特征 第二信号 目标类别 听觉特征 图像特征提取 音频识别技术 声学特征 语音识别 细粒度 准确率 | ||
1.一种噪音信号的识别方法,其特征在于,所述方法包括:
获取待识别噪音信号;
获取所述待识别噪音信号的第一信号特征,所述第一信号特征包括听觉特征和传统特征,所述听觉特征用于指示能够用于语音识别的声学特征;
对所述传统特征进行图像特征提取,得到所述待识别噪音信号的第二信号特征;
根据所述待识别噪音信号的第一信号特征和第二信号特征,对所述待识别噪音信号进行识别,得到所述待识别噪音信号的目标类别。
2.根据权利要求1所述的方法,其特征在于,所述对所述传统特征进行图像特征提取,得到所述待识别噪音信号的第二信号特征包括:
根据所述传统特征中每帧信号的频谱特征,获取所述每帧信号的图像特征,所述每帧信号的图像特征采用不同的灰度表示不同的频谱强度;将所述每帧信号的图像特征按照时间顺序排列,得到所述待识别噪音信号的声谱图,将所述声谱图转换为声谱图片,将所述声谱图片作为所述待识别噪音信号的第二信号特征;和/或,
根据所述待识别噪音信号中每帧信号的传统特征,获取所述待识别信号的波形图、频谱图和倒梅尔谱图中的至少一项,将获取到的谱图转换为相应的谱图图片,将转换得到的谱图图片作为所述待识别噪音信号的第二信号特征。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待识别噪音信号的第一信号特征和第二信号特征,对所述待识别噪音信号进行识别,得到所述待识别噪音信号的目标类别包括:
将所述待识别噪音信号的听觉特征、传统特征和第二信号特征分别输入对应的分类模型,得到所述待识别噪音信号的多个分类结果;
根据所述多个分类结果,得到所述待识别噪音信号的目标类别。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个分类结果,得到所述待识别噪音信号的目标类别包括:
对于所述多个分类结果中的每个分类结果,确定所述分类结果对应分类模型的权重因子;
根据所述每个分类结果对应分类模型的权重因子,对所述多个分类结果进行加权运算,得到目标数值;
根据所述目标数值,确定所述目标类别。
5.根据权利要求3所述的方法,其特征在于,所述待识别噪音信号的听觉特征和第二信号特征对应的分类模型,分别由对不同类型的神经网络进行迭代训练得到。
6.根据权利要求1所述的方法,其特征在于,所述获取所述待识别噪音信号的第一信号特征包括:
对所述待识别噪音信号进行特征提取,得到所述待识别噪音信号的传统特征;
通过预设滤波器对所述传统特征进行滤波,得到所述待识别噪音信号中部分帧信号的频谱,所述预设滤波器用于模拟人耳的非线性特性;
将所述部分帧信号中每帧信号的频谱所指示的频率信息和强度信息,映射为一个多维向量;
将所述部分帧信号中每帧信号对应的多维向量按照时间顺序排列,得到所述待识别噪音信号的听觉特征。
7.一种噪音信号的识别装置,其特征在于,所述装置包括:
第一获取单元,用于获取待识别噪音信号;
第二获取单元,用于获取所述待识别噪音信号的第一信号特征,所述第一信号特征包括听觉特征和传统特征,所述听觉特征用于指示能够用于语音识别的声学特征;
特征提取单元,用于对所述传统特征进行图像特征提取,得到所述待识别噪音信号的第二信号特征;
识别单元,用于根据所述待识别噪音信号的第一信号特征和第二信号特征,对所述待识别噪音信号进行识别,得到所述待识别噪音信号的目标类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611000609.4/1.html,转载请声明来源钻瓜专利网。