[发明专利]一种语块重组题型的自动命题的方法及装置有效
申请号: | 202110559261.7 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113361238B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 殷晓君 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/253;G06Q50/20 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重组 题型 自动 命题 方法 装置 | ||
1.一种语块重组题型的自动命题的方法,其特征在于,所述方法包括:
获取待切分语句以及切分块数K;
通过预设的分词算法对所述待切分语句进行分词,得到所述待切分语句对应的M个词语,所述M个词语对应M-1个切分位,所述M-1大于所述K-1;
分别计算所述M个词语中每两个词语之间的前链接概率以及后链接概率,计算所述M-1个切分位中每个切分位对应的切分合理性得分;
将所述M-1个切分位分别对应的切分合理性得分进行降序排列,选取前N个切分合理性得分对应的切分位,其中,所述N大于所述K-1;
在所述N个切分合理性得分对应的切分位中选取K-1个切分位作为最终切分位组合;
根据所述最终切分位组合,对所述待切分语句进行切分,并将切分后得到的K个语块乱序输出;
其中,所述计算所述M-1个切分位中每个切分位对应的切分合理性得分,包括:
对于所述M-1个切分位中每个切分位,基于切分位对应的两个词语的前链接概率以及后链接概率,通过下述公式(1),确定切分位对应的切分合理性得分:
slot_split_score=log(1-PLeft)+log(1-PRight)……(1)
其中,slot_split_score表示切分位对应的切分合理性得分,PLeft表示切分位对应的两个词语之间的前链接概率,PRight表示切分位对应的两个词语之间的后链接概率;
其中,所述在所述N个切分合理性得分对应的切分位中选取K-1个切分位作为最终切分位组合,包括:
在所述N个切分合理性得分对应的切分位的词语中不重复地选取K-1个切分位,得到种切分位的组合;
对于种切分位的组合中的每种组合,确定对应的选取合理性分数;
确定多个选取合理性分数中的最大值,将所述最大值对应的组合确定为最终切分位组合;
其中,所述确定对应的选取合理性分数,包括:
计算组合中的所有切分位对应的切分合理性得分的和值split_score;
将组合中的所有切分位输入预设的语言模型,得到多个顺序对应的混淆评分,确定多个混淆评分中的最大值作为组合对应的混淆评分lm_score;
通过下述公式(2)计算组合对应的选取合理性分数:
score=w1*split_score+w2*lm_socre……(2)
其中,score表示组合对应的选取合理性分数,w1表示预设的切分合理性得分对应的权重系数,w2表示预设的混淆评分对应的权重系数。
2.根据权利要求1所述的方法,其特征在于,所述分别计算所述M个词语中每两个词语之间的前链接概率以及后链接概率,包括:
获取考试语言能力相关的大数据;
基于所述大数据,统计两个词语之间的前链接概率PLeft(W_j|W_i)以及后链接概率PRight(W_j|W_i),得到词语之间的前链接概率对照表以及后链接概率对照表;
根据所述前链接概率对照表,确定所述M个词语中每两个词语之间的前链接概率;
根据所述后链接概率对照表,确定所述M个词语中每两个词语之间的后链接概率。
3.根据权利要求1所述的方法,其特征在于,所述将切分后得到的K个语块乱序输出,包括:
将切分得到的K个语块按照顺序设置对应的序号;
将K个语块进行随机排列,得到种排列方式;
对于每种排列方式,分别计算任两个相邻语块的序号差值,确定每个序号差值的绝对值减1的数值,得到K-1个数值,计算所述K-1个数值的和值作为乱序程度分数;
确定种排列方式的乱序程度分数的最大值,按照所述最大值对应的排列方式对所述K个语块进行排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110559261.7/1.html,转载请声明来源钻瓜专利网。