[发明专利]一种基于频域信息量分布的回放语音检测方法有效
申请号: | 201610023352.8 | 申请日: | 2016-01-14 |
公开(公告)号: | CN105513598B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 王让定;陈亚楠;严迪群;金超;陶表犁;张立 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L15/08 |
代理公司: | 宁波天一专利代理有限公司 33207 | 代理人: | 刘赛云 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于频域信息量分布的回放语音检测方法,属于一种通过研究原始语音和回放语音在固定频率范围上信息量的分布,从而提出了可用于检测回放语音的方法,而通过这种检测方法可有效检测语音是否为回放语音,这种回放语音检测方法能够有效检测来自偷录设备的回放语音,并在回放环境改变情况下,也具备较高的检测准确性;同时,本发明也验证了检测回放语音检测算法具有较好的鲁棒性,采用这种基于频域信息量分布的回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。 | ||
搜索关键词: | 一种 基于 信息量 分布 回放 语音 检测 方法 | ||
【主权项】:
1.一种基于频域信息量分布的回放语音检测方法,其特征在于该检测方法包括如下步骤:步骤一、提取语音信号的语音频率信息量,设待测语音信号或原始语音信号为X,将待检测语音信号如下操作:(1)将语音信号做分帧处理,设共T帧,然后第i帧语音采样值做N点离散傅里叶变换,所述N为256、512、1024;则第i帧短时傅里叶变换为按照公式一进行计算,公式一,
式中:
——傅里叶变换数值;
——傅里叶变换的离散频率参数;
——语段语音信号中每个采样点;(2)按照公式二对第j帧第i个频率点的频率值
,求幅值;公式二,
式中:
——第i帧j列的傅里叶变换数值;
——傅里叶变换的离散频率参数;(3)按照公式三对第j点频率求其时间上的平均;公式三,
式中:
——表示第j个频率值在时间上的平均;
——第i帧j列的傅里叶变换数值;(4)按照公式四对总频率点上频率值求和;公式四,
式中:
——表示各频率值之和;
——表示第j个频率值在时间上的平均; (5)按照公式五求每一个频率点出现的概率;公式五,
式中:
——表示第j个频率值占总频率值的比重;
——表示第j个频率值在时间上的平均;
——表示各频率值之和; (6)按照公式六对第j频域点求信息量;公式六,
式中:
——标志第j频率点的信息量;
——表示第j个频率值占总频率值得比重;通过上述计算过程分别将待测语音信号和原始语音信号转换为一维数据;步骤二、选取步骤一中语音信号的前N/2个频率点的信息量作为初步特征;步骤三、从语音信号选取的初步特征中低频区特征提取部分中筛选特征集,并选取连续的频率点作为最终特征集;步骤四:通过分类器分别对回放语音信号的特征集和原始语音信号的特征集进行训练模型,将待测语音在训练模型上进行测试,并由分类器最终判断待测语音信号是否为回放语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610023352.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能化信息技术播放设备
- 下一篇:一种语音驱动的智能人机交互方法