[发明专利]实现精准语义和声纹双重识别的方法、系统及存储介质在审
申请号: | 202210378041.9 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114783433A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 罗高涌;张瑾;罗海威;胡宇鹏 | 申请(专利权)人: | 江门市华恩电子研究院有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L17/22;G10L15/16;G10L15/20;G10L17/18;G10L17/20;G10L21/0208;G10L21/0224;G10L21/0232;G10L21/0264;G10L25/30 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 孙浩 |
地址: | 529400 广东省江门市恩平市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 精准 语义 声纹 双重 识别 方法 系统 存储 介质 | ||
本发明公开了一种实现精准语义和声纹双重识别的方法、系统及存储介质,方法包括:获取待处理的语音信号;通过快速的提升小波时频域分析方法对语音信号进行降噪处理,在降噪处理中基于预设的目标滤波器得到语音信号的小波系数;在小波域计算得到小波系数降噪后的移动方差,并根据移动方差得到语音信号二维的语音特征图像;将语音特征图像输入至预设的小波神经网络中,得到语音信号中的声纹和语义。本发明通过快速提升小波变换,进行小波降噪和提取语音特征图像,同时采用高效的小波神经网络,进行声纹和语义双重识别,不仅可以减少系统资源的开销,提高识别的准确率,还可以使系统满足快速实时运算的要求,从而实现更高效的识别过程。
技术领域
本发明涉及语音识别技术领域,特别是涉及一种实现精准语义和声纹双重识别的方法、系统及存储介质。
背景技术
语音信号中的附加信息在一定程度上干扰了语音识别,同时,人类千变万化的语言表达方式也进一步加大了语音识别的难度,相关技术中,目前的声纹识别和语音识别技术,要么只识别个人身份,要么只识别语义内容,没有对语音信号进行充分挖掘,且识别的准确率也不高,不利于语音技术在人机交互中的发展。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种实现精准语义和声纹双重识别的方法、系统及存储介质,能够精准识别语义和声纹。
第一方面,本发明实施例提供了一种实现精准语义和声纹双重识别的方法,包括:
获取待处理的语音信号;
通过快速的提升小波时频域分析方法对所述语音信号进行降噪处理,在降噪处理中基于预设的目标滤波器得到所述语音信号的小波系数;
在小波域计算得到所述小波系数降噪后的移动方差,并根据所述移动方差得到所述语音信号二维的语音特征图像;
将所述语音特征图像输入至预设的小波神经网络中,得到所述语音信号中的声纹和语义。
在一实施例中,所述通过快速的提升小波时频域分析方法对所述语音信号进行降噪处理,在降噪处理中基于预设的目标滤波器得到所述语音信号的小波系数,包括:
根据频带和时隙对所述语音信号进行小波时频分解,并在小波域得到包含噪声信息的初始小波系数;
获取预设的所述目标滤波器,根据所述目标滤波器和所述初始小波系数得到所述小波系数。
在一实施例中,所述根据频带和时隙对所述语音信号进行小波时频分解,并在小波域得到包含噪声信息的初始小波系数,包括:
获取基于所述频带和所述时隙的小波和尺度函数;
用所述小波和所述尺度函数对所述语音信号进行小波时频分解;
根据小波时频分解后的所述语音信号,在小波域得到包含所述噪声信息的所述初始小波系数。
在一实施例中,所述目标滤波器根据以下步骤得到:
通过所述初始小波系数对所述噪声信息建立偏差方程,根据所述偏差方程得到初始滤波器,其中,所述初始小波系数根据所述小波系数和所述噪声信息得到;
通过均方误差定义所述初始滤波器的成本函数;
设定所述成本函数中基于所述小波系数和所述噪声信息的目标数学期望为零,并根据所述噪声信息的噪声方差和所述移动方差得到所述目标滤波器,所述目标滤波器用于最小化所述成本函数。
在一实施例中,所述噪声方差根据以下步骤得到:
根据所述小波系数的中值和预设系数得到所述噪声信息的标准偏差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江门市华恩电子研究院有限公司,未经江门市华恩电子研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210378041.9/2.html,转载请声明来源钻瓜专利网。