[发明专利]一种防口语替考的方法和系统在审

专利信息
申请号: 201711289951.5 申请日: 2017-12-07
公开(公告)号: CN107993661A 公开(公告)日: 2018-05-04
发明(设计)人: 董丽颖 申请(专利权)人: 浙江海洋大学
主分类号: G10L17/00 分类号: G10L17/00;G10L17/02;G10L17/08;G10L17/20
代理公司: 杭州杭诚专利事务所有限公司33109 代理人: 尉伟敏
地址: 316022 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 口语 替考 方法 系统
【说明书】:

技术领域

本发明涉及语音数据处理技术领域,尤其涉及一种防口语替考的方法和系统。

背景技术

随着人们对英语口语的重视逐渐加强,目前,口语测试己经成为大多数英语水平考试的重要组成部分。口语考试规模的日益增大使大量考生的口语数据需要进行评分,这需要大量的人力资源。人工评分是传统的评分方法,但有很多不易解决的问题,如评分员资源短缺、人工评测成本高、评分较主观。尤其是对超大规模的评测,人工评测已难以满足其需求。而且现有的口语考试方式是监考员与考生面对面进行考试,这种方式下考生的作答录音文件未保存。如果考生存在替考行为,而监考人员并未在考试中及时发现的话,后期将难以再次发现。从而影响了口语考试的公平公正,不利于外语人才的考核和选拔。因而需要研发出能够识别出替考考生的防口语替考的方法和系统。

中国专利CN 103065642 B,公开日2015年6月17日,检测口语考试作弊的方法及系统,采用了提取所有考生的考生的测试音数和考题录音数据,根据考生的测试音数和考题录音数据确定各考生的疑似作弊数据集,根据考生的疑似作弊数据集对考生的考生语音数据进行复测,得到作弊检测结果。通过筛选考生疑似作弊集的方法缩小了需要精准对比的作弊数据量,从而加快了检测作弊的速度。然而其仍然需要对每个考生精准对比多个语音数据,仍然存在计算量庞大的问题。

发明内容

本发明要解决的技术问题是目前口语考试中缺乏有效识别替考考生的方法和系统。提出了一种依靠提取和比对声纹的防口语替考的方法和系统。

为解决上述技术问题,本发明所采取的技术方案为:一种防口语替考的方法,包括以下步骤:A)考前由可信任机构采集考生语音信息;B)将采集到的考生语音信息转化为考生可信声纹并保存;C)口语考试后,导入考生的考试语音信息;D)将考生考试语音信息转化为考生考试声纹;E)对比考生考试声纹与考生可信声纹获得相似度值,若相似度值低于阈值则判定考生为替考。

通过可信结构在考前采集考生自己的声纹,口语考试后再将考试录音提取声纹后与考前采集的可信声纹对比,如果差异过大即相似度太小则判定考生存在替考行为,因而可以减少检测需要比对的声纹量,大大减少了检测替考考生的计算量,节约了计算机资源,并加快了检测替考的速度。

作为优选,所述考前由可信任机构采集考生语音信息时将考生按照性别分组分别进行语音信息采集。按性别分组采集能够消除性别差异引起的声纹差异,从而提高声纹比对的准确度。

作为优选,所述将采集到的考生语音信息转化为考生可信声纹包括以下步骤:B1)将采集到的考生语音信息去除环境噪声和静默语音信息,得到预处理语音信息;B2)对预处理语音信号提取语音特征,使用全部考生的语音特征作为参数训练出一个高斯混合模型,作为通用背景模型;B3)使用考生各自语音特征对通用背景模型进行插值,作为该考生的可信声纹。

作为优选,所述将采集到的考生语音信息转化为考生可信声纹包括以下步骤:BB1)将采集到的考生语音信息去除环境噪声和静默语音信息,得到预处理语音信息;BB2)对预处理语音信号提取语音特征,使用全部考生的语音特征作为参数训练出一个高斯混合模型,作为通用背景模型;BB3)使用考生各自语音特征对通用背景模型进行插值,作为该考生的高斯混合模型;BB4)采用因子分析法,从考生的高斯混合模型抽取出I-vector模型,将取出的I-vector模型作为考生的可信声纹。

作为优选,所述将考生考试语音信息转化为考生考试声纹包括以下步骤:D1)将导入考生的考试语音信息去除环境噪声和静默语音信息,得到预处理考试语音信息;D2)对预处理考试语音信号提取考试语音特征,使用全部考生的考试语音特征作为参数训练出一个高斯混合模型,作为考试通用背景模型;D3)使用考生各自考试语音特征对考试通用背景模型进行插值,作为该考生的考试声纹。

作为优选,所述将考生考试语音信息转化为考生考试声纹包括以下步骤:DD1)将导入考生的考试语音信息去除环境噪声和静默语音信息,得到预处理考试语音信息;DD2)对预处理考试语音信号提取考试语音特征,使用全部考生的考试语音特征作为参数训练出一个高斯混合模型,作为考试通用背景模型;DD3)使用考生各自考试语音特征对考试通用背景模型进行插值,作为该考生的考试高斯混合模型;DD4)采用因子分析法,从考生的考试高斯混合模型抽取出I-vector模型,将取出的I-vector模型作为考生考试声纹。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江海洋大学,未经浙江海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711289951.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top