[发明专利]口语考试半开放题型的评分方法及系统无效
申请号: | 201310331979.6 | 申请日: | 2013-08-01 |
公开(公告)号: | CN104346389A | 公开(公告)日: | 2015-02-11 |
发明(设计)人: | 刘丹;魏思;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口语 考试 半开 题型 评分 方法 系统 | ||
1.一种口语考试半开放题型的评分方法,其特征在于,包括:
获取考题对应的所有考生答案;
对所述考生答案进行语音识别,得到与所述考生答案对应的文本字串;
从所述文本字串中提取所述考题对应的主题词,生成主题词集合;
确定所述主题词集合中各单词的权重;
根据所述权重计算所述考生答案的得分。
2.根据权利要求1所述的方法,其特征在于,所述从所述文本字串中提取所述考题对应的主题词,生成主题词集合包括:
从所有参考答案中提取参考答案的主题词;
从所述考生答案对应的文本字串提取考生答案的主题词;
将所述考生答案的主题词进行汇总,生成主题词词表;
统计所述主题词词表中单词和词组出现的概率,并筛选出概率高于设定门限的单词和词组;
将筛选出的单词和词组与所述参考答案的主题词组成主题词集合。
3.根据权利要求1所述的方法,其特征在于,所述确定所述主题词集合中各单词的权重包括:
获取训练样本;
对所述训练样本进行评分,得到所述训练样本的评分分值;
基于评分误差最小化的原则根据所述训练样本的评分分值训练得到所述主题词集合中各单词的权重,所述评分误差为基于权重的评分分值与人工评分分值的差值。
4.根据权利要求3所述的方法,其特征在于,所述获取训练样本包括:
随机选择设定数量的考生答案作为训练样本。
5.根据权利要求3所述的方法,其特征在于,所述获取训练样本包括:
采用传统基于单词命中率评分的方法计算得到各考生答案评分结果;
根据所述考生答案评分结果构建直方图,并从所述直方图中各分值域内随机挑选相同数量的考生答案作为训练样本。
6.一种口语考试半开放题型的评分系统,其特征在于,包括:
答案获取模块,用于获取考题对应的所有考生答案;
识别模块,用于对所述考生答案进行语音识别,得到与所述考生答案对应的文本字串;
主题词集合生成模块,用于从所述文本字串中提取所述考题对应的主题词,生成主题词集合;
权重确定模块,用于确定所述主题词集合中各单词的权重;
得分计算模块,用于根据所述权重计算所述考生答案的得分。
7.根据权利要求6所述的系统,其特征在于,所述主题词集合生成模块包括:
第一提取单元,用于从所有参考答案中提取参考答案的主题词;
第二提取单元,用于从所述考生答案对应的文本字串提取考生答案的主题词;
汇总单元,用于将所述考生答案的主题词进行汇总,生成主题词词表;
筛选单元,用于统计所述主题词词表中单词和词组出现的概率,并筛选出概率高于设定门限的单词和词组;
集合生成单元,用于将筛选出的单词和词组与所述参考答案的主题词组成主题词集合。
8.根据权利要求6所述的系统,其特征在于,所述权重确定模块包括:
样本获取单元,用于获取训练样本;
评分单元,用于对所述训练样本进行评分,得到所述训练样本的评分分值;
训练单元,用于基于评分误差最小化的原则根据所述训练样本的评分分值训练得到所述主题词集合中各单词的权重,所述评分误差为基于权重的评分分值与人工评分分值的差值。
9.根据权利要求8所述的系统,其特征在于,
所述样本获取单元,具体用于随机选择设定数量的考生答案作为训练样本。
10.根据权利要求8所述的系统,其特征在于,所述样本获取单元包括:
计算子单元,用于采用传统基于单词命中率评分的方法计算得到各考生答案评分结果;
直方图构建子单元,用于根据所述考生答案评分结果构建直方图;
选择子单元,用于从所述直方图中各分值域内随机挑选相同数量的考生答案作为训练样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310331979.6/1.html,转载请声明来源钻瓜专利网。