[发明专利]一种基于共词分析和聚类分析的学习需求分析的方法有效
申请号: | 201810964384.7 | 申请日: | 2018-08-23 |
公开(公告)号: | CN109255026B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 赵波;闫旭;王俊;甘健侯 | 申请(专利权)人: | 云南师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 王娟 |
地址: | 650500 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于共词分析和聚类分析的学习需求分析的方法,本发明首先从专题在线学习论坛导出数据,然后借助文字云清洗数据,再将清洗过的数据转换成具有EndNote格式的数据;在此基础上,应用共词分析方法得到其共词矩阵和共异矩阵;应用社会网络图谱分析方法构建其社会网络图谱;借助SPSS软件,并应用聚类方法获得其高频关键词的共词聚类的树状图;最后基于社会网络图谱和高频关键词的共词聚类树状图得到专题在线学习论坛的学习需求层级塔,为有针对性地为在线学习社区提供学习支持服务、答疑解惑、资源的组织和建设奠定基础。 | ||
搜索关键词: | 一种 基于 分析 聚类分析 学习 需求 方法 | ||
【主权项】:
1.一种基于共词分析和聚类分析的学习需求分析的方法,其特征在于:所述方法的具体步骤如下:Step1、构建与专题相关的关键词库Topic_Key;Step2、数据提取:将在线学习论坛中选定的一段时间内的消息导出,得到在线学习论坛的消息数据集合A={(name1,message1),(name2,message2),……,(namen,messagen)};其中,(namen,messagen)表示昵称为namen的学习者在在线学习论坛中发布了消息messagen,n表示消息数据集合中的元组数;Step3、数据清洗:清除在线学习论坛的消息数据集合A中不属于Topic_Key集合的数据,得到经过数据清洗后的消息数据集合![]()
其中(namem,keym)表示昵称为namem的学习者在发言的消息中包含关键词keym,m表示经过数据清洗后的消息数据集合中的元组数;Step4、数据转换:将经数据清洗后的消息数据集合
的每一个元组扩展为EndNote格式的记录,得到集合
Step5、学习需求高频关键词挖掘:应用文献题录统计分析软件对集合
中的关键词统计词频,得到词频集合A_KeyNum={(key1,m1),(key2,m2),……,(keyk,mk)},从A_KeyNum中选择p个词频较高的关键词,构建p个高频关键词的集合
其中,(keyk,mk)表示在线学习论坛中关键词keyk出现了mk次,k表示词频集合A_KeyNum中的元组数;(keyp',Fp)表示在线学习论坛中高频关键词keyp'出现了Fp次;Step6、构建共词矩阵:将词频集合
导入文献题录统计分析软件,并构造p×p的反映高频关键词之间共同出现的频率的共词矩阵Bp×p;Step7、社会网络图谱分析:将共词矩阵Bp×p导入软件,得到在线学习论坛的p个高频关键词构成的社会网络图谱;Step8、构建共异矩阵:将共词矩阵Bp×p转化为相似矩阵
根据相似矩阵,求得共异矩阵
其中,其中I1为元素全为1的矩阵;Step9、高频关键词聚类分析:将共异矩阵
进行聚类处理,选择平方Euclidean距离作为变量距离的测量方法,选择组间平均距离联接作为聚类的方法,得到共词聚类的树状图;Step10、学习需求层级塔构建:根据Step9中的共词聚类的树状图,将关键词进行归类处理;根据Step7的社会网络图谱,将高频关键词集合
被分为三个集合KEY1,KEY2,KEY3;对于每一个分类,如果有多于一半的元素属于KEY1,则对该分类的需求最高,它就处于学习需求层级塔的最底层;否则如果有多于一半的元素属于KEY2,则该分类处于学习需求层级塔的中间层;否则如果有多于一半的元素属于KEY3,则该分类处于学习需求层级塔的最高层。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南师范大学,未经云南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810964384.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种短文本分类方法
- 下一篇:一种电商评论情感分析降噪的方法和装置