[发明专利]基于双向循环链表的语音检测方法在审
| 申请号: | 202211423268.7 | 申请日: | 2022-11-15 |
| 公开(公告)号: | CN115798521A | 公开(公告)日: | 2023-03-14 |
| 发明(设计)人: | 王阳宣;李晓冬;彭世伟;李俊潇;李阳 | 申请(专利权)人: | 四川启睿克科技有限公司 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/03 |
| 代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 陈春光 |
| 地址: | 610000 四川省成都市中国(四川)*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 双向 循环 语音 检测 方法 | ||
1.基于双向循环链表的语音检测方法,其特征在于,包括以下步骤:
步骤1、实时获取音频信号;
步骤2、根据预设帧长对所述音频信号进行分帧处理,按顺序将每帧音频信号存入双向循环链表中的对应节点,并计算每帧音频信号的自适应功率谱密度;
步骤3、根据预设帧数对所述音频信号进行滑动窗口处理,根据对应帧音频信号的自适应功率谱密度确定各窗口的平滑能量谱密度;
步骤4、根据所述平滑能量谱密度判断各窗口音频信号的语音活动状态,所述语音活动状态至少包括活动状态和非活动状态;
步骤5、统计连续处于活动状态和连续处于非活动状态的窗口数,当连续处于非活动状态的窗口数大于第一阈值,并且连续处于活动状态的窗口数大于第二阈值时,根据连续处于活动状态的窗口输出双向循环链表中对应节点的音频信号。
2.如权利要求1所述的基于双向循环链表的语音检测方法,其特征在于,步骤2中,所述每帧音频信号的自适应功率谱密度的计算方法具体包括:
对每帧音频信号进行短时傅里叶变换;
根据短时傅里叶变换结果以及预设频率范围计算对应帧音频信号的功率谱密度;
根据所述功率谱密度计算对应帧音频信号的自适应功率谱密度。
3.如权利要求2所述的基于双向循环链表的语音检测方法,其特征在于,所述短时傅里叶变换公式如下:
式中,X(l,k)表示l帧音频信号k刻度的频域信号,x(n)表示n刻度的时域信号,L表示帧长;
所述预设频率范围为250-3000Hz,所述功率谱密度的计算公式如下:
式中,Φsum(l)表示l帧音频信号的功率谱密度,Φ(l,k)表示l帧音频信号k刻度的功率谱密度,Φ(l,k)=abs[X(l,k)2],abs[]表示幅值函数,df表示频率分辨率。
4.如权利要求3所述的基于双向循环链表的语音检测方法,其特征在于,所述自适应功率谱密度的计算公式如下:
式中,H(l,k)表示l帧音频信号k刻度的自适应功率谱密度,Hsum(l)表示l帧音频信号的自适应功率谱密度。
5.如权利要求1所述的基于双向循环链表的语音检测方法,其特征在于,步骤3中,所述各窗口的平滑能量谱密度的确定方法具体包括:
根据自适应功率谱密度的大小对各窗口对应的每帧音频信号进行排序后,将中间值对应的自适应功率谱密度作为对应窗口的平滑能量谱密度。
6.如权利要求1所述的基于双向循环链表的语音检测方法,其特征在于,步骤4中,所述各窗口音频信号的语音活动状态的判断方法具体包括:
若所述平滑能量谱密度大于或等于第三阈值,则判定对应窗口音频信号的语音活动状态为活动状态,若所述平滑能量谱密度小于第三阈值,则判定对应窗口音频信号的语音活动状态为非活动状态。
7.如权利要求6所述的基于双向循环链表的语音检测方法,其特征在于,所述方法还包括:
若所述平滑能量谱密度大于或等于第三阈值,并且小于或等于第四阈值,则判定对应窗口音频信号的语音活动状态为弱活动状态,若所述平滑能量谱密度大于第四阈值,则判定对应窗口音频信号的语音活动状态为强活动状态,所述第四阈值大于第三阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川启睿克科技有限公司,未经四川启睿克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211423268.7/1.html,转载请声明来源钻瓜专利网。





