[发明专利]一种语音交互玩具有效
申请号: | 201710687681.7 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107464563B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 潘金文 | 申请(专利权)人: | 广州迪宝乐电子有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/20;G10L21/0232;G10L21/0316;G10L25/18;G10L25/21;A63H3/28 |
代理公司: | 北京华识知识产权代理有限公司 11530 | 代理人: | 赵永强 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 玩具 | ||
1.一种语音交互玩具,其特征在于,包括语音采集模块、处理模块、播放模块和升级文件存储模块;所述语音采集模块,与所述处理模块连接,用于获取用户的语音信号,将语音信号发送至处理模块;所述处理模块,用于对接收到的语音信号进行分析处理,根据处理结果在互动文件中查找对应的回复信息,并将所述回复信息发送至所述播放模块进行播放;所述播放模块,与所述处理模块连接,用于对所述回复信息进行播放;所述升级文件存储模块,与所述处理模块连接,用于存储升级文件;
其中,所述处理模块还包括语音处理单元和语义分析单元,所述语音处理单元用于对获取到的语音信号进行识别处理;所述语义分析单元用于对文字数据进行语义分析处理,获取处理结果;
所述语音处理单元包括依次连接的语音增强子单元、有声部分检测子单元、特征提取子单元和语音识别子单元,所述语音增强子单元,用于对获取到的语音信号进行增强处理,获取纯净语音信号;所述有声部分检测子单元,用于获取纯净语音信号中的有声部分;所述特征提取子单元用于获取有声部分的语音特征参数;所述语音识别子单元,用于根据有声部分中每一帧的语音特征参数进行语音识别;
所述语音增强子单元,用于对获取到的语音信号进行增强处理,消除语音信号中的噪声,获取纯净语音信号,包括:
(1)对获取到的语音信号进行分帧、加窗处理;
(2)分别对每一帧获取到的语音信号进行快速傅里叶变换,获取每一帧语音信号的频谱Xn(ejw),其中ejw表示频谱内相应的不同频率,n表示第n帧语音信号;
(3)采用自定义噪声估值函数获取噪声的估计,具体为:
式中,表示前n帧获得的噪声功率谱统计估计,ejw表示功率谱中相应的频率,其中的初始值|Xn(ejw)|2表示第n帧语音信号的功率谱;
由此可得噪声幅度谱的初始平滑估计为即纯净语音信号幅度谱的初始平滑估计为
(4)采用自定义纯净语音估值函数,依次获取每一帧语音信号中的纯净语音信号估计,具体为:
其中,
式中,表示第n帧的纯净语音信号幅度谱估计,ejw表示幅度谱或功率谱中相应的频率,|Xn(ejw)|表示第n帧的语音信号幅度谱,表示第n帧的噪声幅度谱估计,表示第n-1帧的噪声幅度谱的平滑估计,其中ω表示噪声变化速度因子,表示第n-1帧的纯净语音信号幅度谱的平滑估计,其中α表示增强因子,N表示语音信号分帧的总数;
(5)对每一帧纯净语音信号估计进行逆傅里叶变换,获取纯净语音信号;
其中,所述特征提取子单元,用于获取有声部分的语音特征参数,包括:
(1)对获取到的有声部分进行预加重、分帧、加窗处理;
(2)获取有声部分每一帧的特征参数,具体为:
(21)依次对每一帧有声部分进行快速傅里叶变换,获取每一帧有声部分的频谱X″i(f),其中f表示频谱内相应的不同频率,i表示第i帧有声部分;
(22)采用下列滤波器组获取有声部分的特征功率谱B(m),具体为:
m=1,2,…,M,|f-fm|≤bm
其中,
式中,B(m)表示滤波器组中第m个滤波器输出的特征功率谱,m=1,2,…,M,M表示滤波器组中滤波器的个数,c表示滤波器增益,u表示滤波器阶数,bm表示滤波器组中第m个滤波器的带宽,fm表示滤波器组中第m个滤波器的中心频率,fH表示滤波器的截止频率,|X″i(f)|2表示有声部分的功率谱,f表示有声部分功率谱中相应的不同频率,其中|f-fm|≤bm;
其中,对于有声部分功率谱中不同的频率段,由滤波器组中不同的滤波器进行处理,滤波器组覆盖的频率范围为30-4000Hz,超出滤波器组范围的频率记为噪声频率并不进行特征参数提取;
(23)合并从不同滤波器输出的特征功率谱B(m),得到有声部分的特征功率谱B’;
(24)对获取的有声部分特征功率谱B’进行离散余弦变换,获取离散余弦变换后的前M个系数作为本帧有声部分的M维语音特征参数;
(25)重复步骤(21)至(24),直到获取有声部分中每一帧的语音特征参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州迪宝乐电子有限公司,未经广州迪宝乐电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710687681.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音交互式充电系统
- 下一篇:语音交互方法、装置及设备