[发明专利]一种基于频带带宽不一致性的数字语音重采样检测方法有效

专利信息
申请号: 201810478441.0 申请日: 2018-05-18
公开(公告)号: CN108665905B 公开(公告)日: 2021-06-15
发明(设计)人: 严迪群;王志峰;王让定;向立;乌婷婷 申请(专利权)人: 宁波大学
主分类号: G10L25/21 分类号: G10L25/21;G10L25/51
代理公司: 宁波奥圣专利代理有限公司 33226 代理人: 周珏
地址: 315211 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 频带 带宽 不一致性 数字 语音 采样 检测 方法
【权利要求书】:

1.一种基于频带带宽不一致性的数字语音重采样检测方法,其特征在于包括以下步骤:

步骤一:将待重采样检测的数字语音记为X;

步骤二:解析X的头文件信息,得到X的采样率,记为SR;然后根据SR设计一个相应的带通滤波器;其中,带通滤波器的中心频率为C、带宽为B;

步骤三:利用带通滤波器对X进行滤波操作,将带通滤波器对X进行滤波操作后输出的信号记为Y;

步骤四:计算X和Y各自的平均短时能量,对应记为E1和E2

步骤五:计算E1与E2的能量对数比率,记为r,并以r来反映X的频谱图中的频带带宽;

步骤六:根据r和最佳判定阈值Th,判定X是否为经重采样操作得到的数字语音,若r<Th,则判定X为原始的数字语音;若r≥Th,则判定X为经重采样操作得到的数字语音。

2.根据权利要求1所述的一种基于频带带宽不一致性的数字语音重采样检测方法,其特征在于所述的步骤二中,其中,δ为误差项。

3.根据权利要求1所述的一种基于频带带宽不一致性的数字语音重采样检测方法,其特征在于所述的步骤四中,其中,N1表示X中包含的帧的总帧数,1≤n1≤N1,E1(n1)表示X中的第n1帧的短时能量,M1表示X中的每帧包含的采样点信号的总数目,1≤m1≤M1,xn1(m1)表示X中的第n1帧中的第m1个采样点信号,N2表示Y中包含的帧的总帧数,1≤n2≤N2,E2(n2)表示Y中的第n2帧的短时能量,M2表示Y中的每帧包含的采样点信号的总数目,1≤m2≤M2,yn2(m2)表示Y中的第n2帧中的第m2个采样点信号,符号“||”为取绝对值符号。

4.根据权利要求1至3中任一项所述的一种基于频带带宽不一致性的数字语音重采样检测方法,其特征在于所述的步骤六中的最佳判定阈值Th的获取过程为:

1)选取Nelect个时长大于或等于2秒的原始数字语音,并获取每个原始数字语音的重采样语音;然后将每个原始数字语音作为负样本,将每个原始数字语音的重采样语音作为正样本;其中,Nelect≥100;

2)按照步骤一至步骤五的过程,以相同的方式获取每个正样本对应的能量对数比率和每个负样本对应的能量对数比率;然后将所有正样本对应的能量对数比率和所有负样本对应的能量对数比率按从大到小的顺序排列,构成能量对数比率集,将能量对数比率集中的第nelect个能量对数比率记为relect;其中,nelect为正整数,1≤nelect≤2Nelect

3)将能量对数比率集中的每个能量对数比率作为候选阈值;然后计算在每个候选阈值下的真正类率和假正类率,将在relect作为候选阈值下的真正类率和假正类率对应记为TPRelect和FPRelect

4)根据在所有候选阈值下的真正类率和假正类率,绘制得到ROC曲线;然后以ROC曲线的敏感度和特异度同时达到最大时所对应的候选阈值作为最佳判定阈值Th。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810478441.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top