[发明专利]一种语块重组题型的自动命题的方法及装置有效
申请号: | 202110559261.7 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113361238B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 殷晓君 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/253;G06Q50/20 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重组 题型 自动 命题 方法 装置 | ||
本发明涉及语言教学技术领域,特别是指一种语块重组题型的自动命题的方法及装置,方法包括:获取待切分语句以及切分块数K;通过预设的分词算法对待切分语句进行分词,得到待切分语句对应的M个词语;分别计算每两个词语之间的前链接概率以及后链接概率,计算每个切分位对应的切分合理性得分;将M‑1个切分位分别对应的切分合理性得分进行降序排列,选取前N个切分合理性得分对应的切分位,其中,N大于K‑1;在N个切分合理性得分对应的切分位中选取K‑1个切分位作为最终切分位组合;根据最终切分位组合,对待切分语句进行切分,并将切分后得到的K个语块按乱序程度分取最高得分输出。采用本发明,可以高效率地生成难度可控的、合理的题目。
技术领域
本发明涉及语言教学技术领域,特别是指一种语块重组题型的自动命题的方法及装置。
背景技术
当前在对外汉语教学中广泛使用语言教学语块重组题型的题目,如HSK考试。这种题型的题目通常是将原本完整、正确的一句话切分、打乱后生成的语块,由考生通过这多个乱序的语块组合成完整、语法正确的一句话语。目前,这种题型的出题完全依赖于教师的主观判断,效率低下,且缺乏科学性。
发明内容
本发明实施例提供了一种语块重组题型的自动命题的方法及装置。所述技术方案如下:
一方面,提供了一种语块重组题型的自动命题的方法,该方法应用于电子设备,该方法包括:
获取待切分语句以及切分块数K;
通过预设的分词算法对所述待切分语句进行分词,得到所述待切分语句对应的M个词语,所述M个词语对应M-1个切分位,所述M-1大于所述K-1;
分别计算所述M个词语中每两个词语之间的前链接概率以及后链接概率,计算所述M-1个切分位中每个切分位对应的切分合理性得分;
将所述M-1个切分位分别对应的切分合理性得分进行降序排列,选取前N个切分合理性得分对应的切分位,其中,所述N大于所述K-1;
在所述N个切分合理性得分对应的切分位中选取K-1个切分位作为最终切分位组合;
根据所述最终切分位组合,对所述待切分语句进行切分,并将切分后得到的K个语块乱序输出。
可选地,所述分别计算所述M个词语中每两个词语之间的前链接概率以及后链接概率,包括:
获取考试语言能力相关的大数据;
基于所述大数据,统计两个词语之间的前链接概率PLeft(W_j|W_i)以及后链接概率PRight(W_j|W_i),得到词语之间的前链接概率对照表以及后链接概率对照表;
根据所述前链接概率对照表,确定所述M个词语中每两个词语之间的前链接概率;
根据所述后链接概率对照表,确定所述M个词语中每两个词语之间的后链接概率。
可选地,所述计算所述M-1个切分位中每个切分位对应的切分合理性得分,包括:
对于所述M-1个切分位中每个切分位,基于切分位对应的两个词语的前链接概率以及后链接概率,通过下述公式(1),确定切分位对应的切分合理性得分:
slot_split_score=log(1-PLeft)+log(1-PRight)……(1)
其中,slot_split_score表示切分位对应的切分合理性得分,PLeft表示切分位对应的两个词语之间的前链接概率,PRight表示切分位对应的两个词语之间的后链接概率。
可选地,所述在所述N个切分合理性得分对应的切分位中选取K-1个切分位作为最终切分位组合,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110559261.7/2.html,转载请声明来源钻瓜专利网。