[发明专利]基于双输入互干扰卷积神经网络的异常语音识别方法有效
申请号: | 202110439720.8 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113223507B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 陈里里;白怀伟;余波;胡雪 | 申请(专利权)人: | 重庆交通大学 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L25/51;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 胡博文 |
地址: | 400074 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 输入 干扰 卷积 神经网络 异常 语音 识别 方法 | ||
本发明提供的一种于双输入互干扰卷积神经网络的异常语音识别方法,包括:S1.采集语音信号,并对语音信号进行分割预处理得到语音样本;S2.构建双输入互干扰卷积神经网络,所述双输入互干扰卷积神经网络包括第一卷积单元、第二卷积单元、特征融合单元、全连接单元以及分类输出单元;所述第一卷积单元具有5层卷积核,第二卷积单元具有7层卷积核,所述第一卷积单元和第二卷积单元输入相同的语音样本,所述第一卷积单元和第二卷积单元向特征融合单元输出特征提取结果,所述特征融合单元对特征提取结果进行融合处理并输出至全连接单元分类输出单元;分类输出单元根据全连接单元输出的处理后的特征提取结果进行分类识别输出异常语音,通过本发明,能够对人体发出的语音信号中的异常语音进行准确识别,从而确保识别精度,而且灵敏度高。
技术领域
本发明涉及一种语音识别方法,尤其涉及一种基于双输入互干扰卷积神经网络的异常语音识别方法。
背景技术
咽喉疾病将导致声带功能障碍,从而引起发出的语音出现异常,那么如何实现人体发出的语音信号的异常识别则存在极大的难点。
现有技术中,对于异常语音信号的识别采用如下方式:基于音位谱的异常语音识别,基于相互信息、假邻居分数和Lyapunov谱的度量方法来进行识别,但是,这些方法识别的准确性差,虽然现有技术中还提出了基于计算机进行升学分析,但是,其准确性、灵敏度都比较差。
因此,为了解决上述技术问题,亟需提出一种新的技术手段。
发明内容
有鉴于此,本发明的目的是提供一种基于双输入互干扰卷积神经网络的异常语音识别方法,能够对人体发出的语音信号中的异常语音进行准确识别,从而确保识别精度,而且灵敏度高。
本发明提供的一种于双输入互干扰卷积神经网络的异常语音识别方法,包括以下步骤:
S1.采集语音信号,并对语音信号进行分割预处理得到语音样本;
S2.构建双输入互干扰卷积神经网络,所述双输入互干扰卷积神经网络包括第一卷积单元、第二卷积单元、特征融合单元、全连接单元以及分类输出单元;
所述第一卷积单元具有5层卷积核,第二卷积单元具有7层卷积核,所述第一卷积单元和第二卷积单元输入相同的语音样本,所述第一卷积单元和第二卷积单元向特征融合单元输出特征提取结果,所述特征融合单元对特征提取结果进行融合处理并输出至全连接单元分类输出单元;分类输出单元根据全连接单元输出的处理后的特征提取结果进行分类识别输出异常语音。
进一步,步骤S1中,对语音信号进行分割预处理包括:
确定语音信号的最大可分割样本数量m:
其中,λ为分割重复率,N为语音信号的样本点个数,L为分割后语音样本的长度,|·|表示向下取整;
确定每个语音样本的数据:
data(i)=Raw_data(s(λ,i));
其中,Raw_data表示原始语音数据,data(i)表示某一原始语音信号分割后产生的第i个样本,s(λ,i)表示区间在[(i-1)λL,(i-1)λL+L]上所有点的集合。
进一步,步骤S2中,对双输入互干扰卷积神经网络采用如下方法进行训练:
构建损失函数:
其中,m表示每次训练样本数量,yj表示第j个逻辑神经元的目标概率,表示第j个逻辑神经元的预测概率,W表示第i层到第i+1层的权重,b表示第i层到第i+1层的偏置;
确定第l层的损失误差χl:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆交通大学,未经重庆交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110439720.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于PLC的显示板检测方法
- 下一篇:一种防滑瓶盖