[发明专利]一种题目分类及推送的方法及系统有效
申请号: | 201611009278.0 | 申请日: | 2016-11-16 |
公开(公告)号: | CN106599054B | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 刘德建;章亮;詹博悍;陈霖;吴拥民;陈宏展 | 申请(专利权)人: | 福建天泉教育科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458;G06F16/242 |
代理公司: | 35214 福州市博深专利事务所(普通合伙) | 代理人: | 林志峥 |
地址: | 350212 福建省福州市长乐*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 题目 分类 推送 方法 系统 | ||
1.一种题目分类及推送的方法,其特征在于,包括:
S1、根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;
所述第一分类集合为预设知识点的集合;
S2、计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;
S3、根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;
S4、根据所述第二关联度集合,得到近似题集合;
S5、推送所述近似题集合;
所述S1具体为:
根据预设的转义字符转换所述第一题目中的符号,得到第二题目;
提取所述第二题目的特征,得到特征向量;所述特征向量包括词频向量和语义向量;
根据所述预设知识点分类模型,得到与所述特征向量相应的第一分类集合和第一关联度集合;
提取所述第二题目的特征,得到特征向量;所述特征向量包括词频向量和语义向量,具体为:
解析所述第二题目,得到中文字符栈和非中文字符栈;
使用切词算法对所述中文字符栈中的字符进行切词处理,并使用预设的正则表达式匹配所述非中文字符栈中存储的公式,得到第三题目;
从所述第三题目中删除停止词,得到第四题目;
根据所述第四题目构建词频向量;所述词频向量中元素的个数为所述第四题目中不同词的数量,所述词频向量中元素的值为与所述元素相应的词在所述第四题目中出现的次数;
根据预设的维度建立语义特征抽取模型;
根据所述语义特征抽取模型构建与所述第四题目相应的语义向量;
根据所述预设知识点分类模型,得到与所述特征向量相应的第一分类集合和第一关联度集合,具体为:
部署基于词频的知识点分类模型于预设分类集群中的节点;
部署基于语义的知识点分类模型于预设分类集群中的节点;
发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合;
所述根据所述相似度集合和所述第一关联度集合,得到第二关联度集合包括:
获取所述第一分类集合中第一关联度较大的四个元素,将题库中所有属于所述四个元素涉及的知识点的题目的TF-IDF向量提取出来;
分别利用余弦距离公式将所提取出来的题目与第一题目的特征向量计算余弦距离;
将得到的所有题目与第一题目的余弦距离进行排序得到第二关联度集合;
所述根据所述第二关联度集合,得到近似题集合具体为:
根据所述第二关联度集合排序所述第一分类集合中的分类,得到第一分类队列;
从所述第一分类队列中获取预设分类数的分类,得到第二分类集合;
获取所述第二分类集合中与所述第一题目的相似度大于预设相似度阈值的题目,得到近似题集合;
获取所述近似题集合中各题目对应的分类,得到第三分类集合;
根据所述第三分类集合更新所述预设知识点分类模型。
2.根据权利要求1所述的题目分类及推送的方法,其特征在于,所述S1具体为:
部署不同的预设知识点分类模型于预设分类集群中的各节点;
发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建天泉教育科技有限公司,未经福建天泉教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611009278.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维模型检索方法
- 下一篇:一种检测数据库检查点操作运行状态的方法