[发明专利]一种面向在线社交网络的主题社区挖掘方法有效
申请号: | 201610059166.X | 申请日: | 2016-01-28 |
公开(公告)号: | CN105760426B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 贺超波;汤庸;刘海;陈国华;付志文;杨灵;张世龙 | 申请(专利权)人: | 仲恺农业工程学院;华南师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510220 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种面向在线社交网络的主题社区挖掘方法,该方法是基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的主题社区挖掘方法,可以通过NMF模型统一集成用户节点链接和内容信息,并应用矩阵近似分解方法得到用户节点与社区之间的归属关系矩阵以及各社区与主题特征词之间的关联强度矩阵,从而可以利用分解矩阵信息直接挖掘主题社区。该方法不仅可以采用统一模型处理用户节点的链接和内容两类信息,而且挖掘过程更加简单有效,具备更好的挖掘质量,因此更适合实际应用于挖掘在线社交网络存在的主题社区。 | ||
搜索关键词: | 一种 面向 在线 社交 网络 主题 社区 挖掘 方法 | ||
【主权项】:
1.一种面向在线社交网络的主题社区挖掘方法,其特征包括:步骤1:形式化表示在线社交网络:将在线社交网络形式化表示为无向图G=(V,E,T),其中V={v0,v1,...,vn‑1}为用户节点集合,E={eij|vi∈V,vj∈V}为用户节点的链接边集合,T={t0,t1,...,tm‑1}为主题特征词汇集合,且有n=|V|以及m=|T|;步骤2:构建用户节点链接矩阵
和主题特征词关联矩阵
其中
表示非负数;对于任意两个用户节点vi和vj,如果
则X中对应的元素xij=xji=1,否则xij=xji=0;由于能够从用户节点的内容信息中抽取出每个节点所关联的主题特征词集合,那么
都能够关联一个主题特征词向量(y0i,y1i,...,y(m‑1)i),其中yji用于表示用户节点vi在特征词tj的取值,所有用户节点关联的主题特征词向量计算完成后,则构成主题特征词关联矩阵Y;步骤3:构建主题社区挖掘模型:设社区挖掘数为k,令
用于表示用户节点与主题社区的归属关系矩阵,
用于表示主题社区之间的交互程度矩阵,
表示主题特征词与主题社区的关联强度矩阵,
表示非负数,则主题社区挖掘模型为:
其中上标T表示矩阵转置;下标F表示Frobenius范数;步骤4:求解主题社区挖掘模型:通过将最小化目标函数J(H,S,W)转化为典型的受限约束求极值问题,然后应用拉格朗日乘数方法进行求解;步骤5:获取主题社区挖掘结果:首先设定迭代次数t以及收敛阈值ω,随机初始化H,S以及W,然后迭代应用H,S以及W的乘性迭代求解规则,当迭代次数超过t或者
则可以获得H,S以及W的局部最优解,最后根据H获取k个主题社区:假定待挖掘的k个主题社区为C={c0,c1,...,ck‑1},对于任意一个用户节点vi,
其中hil表示用户节点i与主题社区l的归属强度,
表示将节点i具有最大归属强度的社区序号赋值给p,则有cp=cp U{vi}。;且对于任意一个社区ci,根据W对应的列向量Wi获取该社区关联的主题特征词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院;华南师范大学,未经仲恺农业工程学院;华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610059166.X/,转载请声明来源钻瓜专利网。
- 上一篇:变压器的电池形接头
- 下一篇:用于存储企业产品关键数据的数据库建立方法