[发明专利]试题文本的知识点确定方法、电子设备及存储介质有效
申请号: | 201810947324.4 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109359290B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 张磊;李首峰;孙立宏;陈放;李莉莉 | 申请(专利权)人: | 国政通科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30;G06F40/211;G06F40/242 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100195 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 试题 文本 知识点 确定 方法 电子设备 存储 介质 | ||
本申请公开了一种试题文本的知识点确定方法、电子设备及存储介质。该方法包括读取预设的知识点列表;对试题文本进行分词处理以获得多个分词;根据知识点列表确定第一类分词集合和第二类分词集合,其中,第一类分词集合为多个分词中包含在预设的知识点列表中的分词集合,第二类分词集合为多个分词中不包含在预设的知识点列表中的分词集合;若第一类分词集合不为空集合,根据预设规则确定第一类分词集合中的一分词作为试题文本的知识点;若第一类分词集合为空集合,确定第二类分词集合中频次最高且包含在预设的关键词列表中的分词作为试题文本的知识点,其中,关键词列表大于知识点列表。以至少部分地解决试题文本分析中建模困难、算法复杂、准确度不高的问题。
背景技术
题库数据是重要的教学资源,而题库中题目的知识点数据项则有着十分重要的作用,它是题库分类检索的重要字段,也是各种延伸应用的基础。在实际的中考和高考中,学生试卷的打分,也是在遵循一个“踏点得分”的原则,即只要考察的知识点按步骤写出来了,即使题没有解出来,也能得到相应部分的分数。
然而知识点的生成是一项非常费人工事情,通常需要教学经验丰富的老师根据题意列出知识点,经过审核、录入和校对等环节后再入库,这样每个题目的知识点生产要花2至3元的成本。在题库数量动辄以几百万乃至上千万规模的今天,这无疑是一笔耗资巨大的投入;同时,真正操作时需要的人员组织、管理以及工期耗时都是令人头疼的事。
专利文献CN106570109A公开了一种通过文本分析自动生成题库知识点的方法。但是,采用该方法仍然可能会存在建模比较困难、算法复杂、准确度不够高的问题。
发明内容
本申请提供了一种试题文本的知识点确定方法、电子设备及存储介质,以至少部分地解决题文本分析中建模困难、算法复杂、准确度不高的问题。
一种试题文本的知识点确定方法,其特征在于,所述方法包括:
读取预设的知识点列表;
对所述试题文本进行分词处理以获得多个分词;
根据所述知识点列表确定第一类分词集合和第二类分词集合,其中,所述第一类分词集合为所述多个分词中包含在所述预设的知识点列表中的分词集合,所述第二类分词集合为所述多个分词中不包含在所述预设的知识点列表中的分词集合;
若所述第一类分词集合不为空集合,根据预设规则确定所述第一类分词集合中的一分词作为所述试题文本的知识点;
若所述第一类分词集合为空集合,确定所述第二类分词集合中频次最高且包含在预设的关键词列表中的分词作为所述试题文本的知识点,其中,所述关键词列表大于所述知识点列表。
可选的,所述知识点列表中包含与所述试题文本的科目对应的多个第一类知识点。
可选的,所述关键词列表中包含与所述试题文本的科目对应的多个第二类知识点,其中,所述第一类知识点在所述科目中出现的频次大于所述第二类知识点在所述科目中出现的频次。
可选的,所述对所述试题文本进行分词处理以获得多个分词,包括:
基于统计机器学习对所述试题文本进行分词处理以获得多个分词。
可选的,所述据预设规则确定所述第一类分词集合中的一分词作为所述试题文本的知识点,包括:
确定所述第一类分词集合中出现频次最高的分词作为所述试题文本的知识点。
可选的,所述据预设规则确定所述第一类分词集合中的一分词作为所述试题文本的知识点,包括:
确定所述第一类分词集合中出现频次达到预设值的至少一个分词作为所述试题文本的知识点。
可选的,所述方法包括:
存储所述知识点与所述试题文本的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国政通科技有限公司,未经国政通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810947324.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于本体的Web服务功能相似性度量方法
- 下一篇:一种命名实体识别方法