[发明专利]基于自然语言处理的教育资源质量评价挖掘方法及系统有效

专利信息
申请号: 201910431440.5 申请日: 2019-05-22
公开(公告)号: CN110147552B 公开(公告)日: 2022-12-06
发明(设计)人: 季一木;许正阳;刘强;刘尚东;尧海昌;李奎;刘艳兰 申请(专利权)人: 南京邮电大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06Q10/06;G06Q50/20
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 彭雄
地址: 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于自然语言处理的教育资源质量评价挖掘方法及系统,首先从海量教育评论数据中使用自然语言处理技术挖掘用户评价观点,以评价对象,评价词二元组存储。其次,以评价对象,评价词为指标结点建立。然后基于教育资源语料库通过神经网络对词向量进行训练,建立词到向量的模型。再对评价对象进行聚类,再按照floyd算法选出中心向量。接着对评价词进行聚类,生成资源评价指标树,选出的中心向量作为评价指标树的结点,最后对评价词进行情感分析并打分输出。解决了基于众筹众创的数字教育评价数据量过大,人工评价方法成本高、难度大、主观性高等问题。
搜索关键词: 基于 自然语言 处理 教育 资源 质量 评价 挖掘 方法 系统
【主权项】:
1.一种基于自然语言处理的教育资源质量评价挖掘方法,其特征在于,包括以下步骤:步骤1,采集教育资源评价数据,去除无效评论;步骤2,评价搭配抽取;能够表达用户情感的评价对象和评价短语由多个词语组成,每一组词构成一个<评价对象,评价词>的评价搭配;对评价进行分句,用带权词典构建Trie树,根据Trie树对待分句生成所有可能词为结点组成的有向无环图,通过动态规划法以权值最大的路径输出为分词结果;再对待处理句子进行依存句法分析,然后将满足规则关系的搭配提取为评价搭配二元组,以<评价对象,评价词>的结构保存;步骤3,将自然语言向量化;word2vec采用的模型包含了连续词袋模型CBOW和Skip‑Gram模型;通过word2vec进行高效训练从而得到词向量,词向量之间的距离表示词和词之间的相似程度;步骤4,构建knn聚类模型;取评价对象向量集合Si,包含i个m种类的评价搭配词向量模型,当第i+1个词向量加入集合时,计算Ci+1与所有向量的余弦相似度sim;确定k的值为N×A,N为元组总数,A这里取1/10,将sim按照从小到大的顺序排序,选取前k个向量tensors,统计这k个向量中所属分类比例最大的,则这个向量属于该分类;步骤5,选出中心评价对象向量;通过floyd算法计算每一类中所有向量之间的余弦相似度,保存在矩阵S中,S[i][j]表示向量i与向量j的余弦相似度;遍历S选取与其他向量相似度最小的向量作为类别的中心向量;中心向量对应的评价对象则为中心评价对象;步骤6,选出中心评价词对象;在以评价对象分的每一类中重复步骤5,选出中心词评价向量组;步骤7,生成评价树;生成以<资源,评价对象,评价词>为结点的评价树,其中,资源为根结点,评价对象为二级结点,评价词为三级结点;步骤8,对评价词进行情感分析;经过分类统计,得到关于评价对象的情感得分,再通过权重矩阵值得出整个资源的评分;将情感分成两类标签集:消极和积极;对于消极的评价词,我们记作‘‑1’,积极的评价词记做‘1’;对于某含有a个中心词的评价对象O,它的评分值属于[‑a,a]区间;对于含有x个评价对象的资源,它的评分值属于[‑x*a,x*a];步骤9,用户偏好矩阵构建;对于x个评价对象,获得用户偏好向量X,有Xi∈(0,1),用户对某一评价对象偏好越大,相应的Xi值就越大;步骤10,获得资源评价得分;将评价对象得分向量A与用户偏好向量X点乘,获得最后的资源评价得分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910431440.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top