[发明专利]基于小波神经网络的声纹特征提取模型构建方法及系统在审
申请号: | 202111492798.2 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114141256A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 高军;张志伟;杨爽;张高峰;杨宇;常晓鹏 | 申请(专利权)人: | 国家电网有限公司;国网山东省电力公司菏泽供电公司 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L17/04 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 秦莹 |
地址: | 274000 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 声纹 特征 提取 模型 构建 方法 系统 | ||
本发明公开了一种基于小波神经网络的声纹特征提取模型构建方法及系统,所述方法包括:获取特定格式的声音数据,对所述声音数据进行预处理,转化为固定维度的声音信号;选择小波基函数,将所述小波基函数设置为神经网络隐藏层中神经元的传递激发函数,构造小波神经网络,设置训练参数;将所述声音信号输入所述小波神经网络进行计算,基于输出的预测值和真实值,根据所述训练参数对小波神经网络进行迭代训练,获得声纹特征提取模型。使用的小波神经网络模型训练简单,专业性要求低,得到的特征提取模型抗噪性能优秀,具有更强的表征能力。
技术领域
本发明涉及声纹识别技术领域,尤其是涉及一种基于小波神经网络的声纹特征提取模型构建方法及系统。
背景技术
声纹识别是对说话人的声音识别或者验证的应用系统,是通过辨别说话人声音信号中的独有特征来区分说话人的技术。特征提取是声纹识别中非常重要的一步,是将输入的说话人声音信号提取出特征向量,从而减少信息冗余,降低计算复杂度,降低噪声干扰,便于后续处理。由于语音具有短时平稳性,所以我们可以对声音信号进行分帧,得到每一帧再进行处理,就可以得到声音信号的短时频谱特征。当前使用最广泛的短时频谱特征是Mel倒谱系数。
Mel倒谱系数的步骤一般包括:数据预处理、快速傅里叶变换和倒谱计算。其中数据预处理包括预加重、分帧和加窗;倒谱计算包括计算Mel滤波器组、对数运算和离散余弦变换。计算Mel倒谱系数使用的傅里叶变换主要是三角函数(正弦函数或余弦函数)的线性组合,三角函数是全时域的,受到局部噪音的影响之后就会影响整个频谱,导致Mel倒谱系数抗噪性能较差。
发明内容
本发明的目的在于提供一种基于小波神经网络的声纹特征提取模型构建方法及系统,旨在解决Mel倒谱系数抗噪性能较差以及提取流程繁复的问题。
本发明提供一种基于小波神经网络的声纹特征提取模型构建方法,包括:
S1.获取特定格式的声音数据,对所述声音数据进行预处理,转化为固定维度的声音信号;
S2.选择小波基函数,将所述小波基函数设置为神经网络隐藏层中神经元的传递激发函数,构造小波神经网络,设置训练参数;
S3.将所述声音信号输入所述小波神经网络进行计算,基于输出的预测值和真实值,根据所述训练参数对小波神经网络进行迭代训练,获得声纹特征提取模型。
本发明提供一种基于小波神经网络的声纹特征提取模型构建系统,包括:
数据处理模块:用于获取特定格式的声音数据,对所述声音数据进行预处理,转化为固定维度的声音信号;
模型构建模块:用于通过将选择的小波基函数设置为神经网络隐藏层中神经元的传递激发函数,构造小波神经网络,设置训练参数;
模型训练模块:用于将所述声音信号输入所述小波神经网络进行计算,基于输出的预测值和真实值,根据所述训练参数对小波神经网络进行迭代训练,获得声纹特征提取模型。
本发明实施例还提供一种基于小波神经网络的声纹特征提取模型构建设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述模型构建方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述模型构建方法的步骤。
本发明实施例中的小波神经网络模型训练简单,对专业性的要求低;最终得到的特征提取模型抗噪性能优秀;小波神经网络能够提取声音信号的深层特征,具有更强的表征能力。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国网山东省电力公司菏泽供电公司,未经国家电网有限公司;国网山东省电力公司菏泽供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111492798.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:双线程渲染方法、装置及存储介质
- 下一篇:一种灯杆焊缝打磨装置