[发明专利]口语考试半开放题型的评分方法及系统无效
申请号: | 201310331979.6 | 申请日: | 2013-08-01 |
公开(公告)号: | CN104346389A | 公开(公告)日: | 2015-02-11 |
发明(设计)人: | 刘丹;魏思;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口语 考试 半开 题型 评分 方法 系统 | ||
技术领域
本发明涉及语音信号处理技术领域,具体涉及一种口语考试半开放题型的评分方法及系统。
背景技术
作为人际交流的重要媒介,口语语言在实际生活中占有极其重要的地位。随着社会经济的不断发展和全球化趋势的加剧,人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。而半开放式题型,如问答题或限定内容表述题等,实际考察了考生交流及表述能力,因而也成为口语考试的重点内容。在对半开放式题型的评测中,考生对考题内容表述的准确度或者说与参考答案的一致度是评价答题水平的重点指标。
传统的口语评分系统在对半开放式题型评分时往往更关注考生答案相应于预设参考答案的单词命中率,即考生答案和参考答案的重合度。在该设置下,考生答案中的所有单词具有相同权重,忽视了不同单词对语义表达正确性可能有不同影响。基于单词命中率的评分方法容易导致对考生答题准确程序评价不够客观,如考生答案“This is a”,其相应于参考答案“This is a handbag”,可以获得0.75的单词命中率,然而另一个更为正确的简化表述“Handbag”将仅获得0.25的单词命中率,明显违背了答题准确率评分的准则。
为此,界业提出了一种基于TF*IDF(Term Frequency–Inverse Document Frequency,词频*逆向文件频率)参数设置的评分方法调整考生答案中各单词的权重设置。但这种评分方法仅考虑考生答案和参考答案相应单词在语义上的相似度,而没有针对性地考虑各单词对“问题回答正确”判断的重要程度。比如对问题“How many watermelons are there on the desk?”的参考答案为“There are two watermelons.”在该答案中单词“two”对答题正确与否的判断重要性更高,因而应该具有更高的权重值。然而在基于TF*IDF单词权重的设置下单词“two”的IDF将小于“watermelons”,显然违背了评分的客观性。此外基于TF*IDF参数值设置的评分方法对每个考生答案的每个主题词都要实时动态确定其相应重要性特征,一方面影响了系统运算效率,另一方面对系统评分稳定性也有一定程度的影响。
发明内容
本发明实施例提供一种口语考试半开放题型的评分方法及系统,以提高口语评分的准确性。
为此,本发明提供如下技术方案:
一种口语考试半开放题型的评分方法,包括:
获取考题对应的所有考生答案;
对所述考生答案进行语音识别,得到与所述考生答案对应的文本字串;
从所述文本字串中提取所述考题对应的主题词,生成主题词集合;
确定所述主题词集合中各单词的权重;
根据所述权重计算所述考生答案的得分。
优选地,所述从所述文本字串中提取所述考题对应的主题词,生成主题词集合包括:
从所有参考答案中提取参考答案的主题词;
从所述考生答案对应的文本字串提取考生答案的主题词;
将所述考生答案的主题词进行汇总,生成主题词词表;
统计所述主题词词表中单词和词组出现的概率,并筛选出概率高于设定门限的单词和词组;
将筛选出的单词和词组与所述参考答案的主题词组成主题词集合。
优选地,所述确定所述主题词集合中各单词的权重包括:
获取训练样本;
对所述训练样本进行评分,得到所述训练样本的评分分值;
基于评分误差最小化的原则根据所述训练样本的评分分值训练得到所述主题词集合中各单词的权重,所述评分误差为基于权重的评分分值与人工评分分值的差值。
优选地,所述获取训练样本包括:
随机选择设定数量的考生答案作为训练样本。
优选地,所述获取训练样本包括:
采用传统基于单词命中率评分的方法计算得到各考生答案评分结果;
根据所述考生答案评分结果构建直方图,并从所述直方图中各分值域内随机挑选相同数量的考生答案作为训练样本。
一种口语考试半开放题型的评分系统,包括:
答案获取模块,用于获取考题对应的所有考生答案;
识别模块,用于对所述考生答案进行语音识别,得到与所述考生答案对应的文本字串;
主题词集合生成模块,用于从所述文本字串中提取所述考题对应的主题词,生成主题词集合;
权重确定模块,用于确定所述主题词集合中各单词的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310331979.6/2.html,转载请声明来源钻瓜专利网。