[发明专利]一种面向在线社交网络的主题社区挖掘方法有效
申请号: | 201610059166.X | 申请日: | 2016-01-28 |
公开(公告)号: | CN105760426B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 贺超波;汤庸;刘海;陈国华;付志文;杨灵;张世龙 | 申请(专利权)人: | 仲恺农业工程学院;华南师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510220 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 在线 社交 网络 主题 社区 挖掘 方法 | ||
1.一种面向在线社交网络的主题社区挖掘方法,其特征包括:
步骤1:形式化表示在线社交网络:
将在线社交网络形式化表示为无向图G=(V,E,T),其中V={v0,v1,...,vn-1}为用户节点集合,E={eij|vi∈V,vj∈V}为用户节点的链接边集合,T={t0,t1,...,tm-1}为主题特征词汇集合,且有n=|V|以及m=|T|;
步骤2:构建用户节点链接矩阵和主题特征词关联矩阵其中表示非负数;
对于任意两个用户节点vi和vj,如果则X中对应的元素xij=xji=1,否则xij=xji=0;
由于能够从用户节点的内容信息中抽取出每个节点所关联的主题特征词集合,那么都能够关联一个主题特征词向量(y0i,y1i,...,y(m-1)i),其中yji用于表示用户节点vi在特征词tj的取值,所有用户节点关联的主题特征词向量计算完成后,则构成主题特征词关联矩阵Y;
步骤3:构建主题社区挖掘模型:
设社区挖掘数为k,令用于表示用户节点与主题社区的归属关系矩阵,用于表示主题社区之间的交互程度矩阵,表示主题特征词与主题社区的关联强度矩阵,表示非负数,则主题社区挖掘模型为:
其中上标T表示矩阵转置;下标F表示Frobenius范数;
步骤4:求解主题社区挖掘模型:
通过将最小化目标函数J(H,S,W)转化为典型的受限约束求极值问题,然后应用拉格朗日乘数方法进行求解;
步骤5:获取主题社区挖掘结果:
首先设定迭代次数t以及收敛阈值ω,随机初始化H,S以及W,然后迭代应用H,S以及W的乘性迭代求解规则,当迭代次数超过t或者则可以获得H,S以及W的局部最优解,最后根据H获取k个主题社区:假定待挖掘的k个主题社区为C={c0,c1,...,ck-1},对于任意一个用户节点vi,其中hil表示用户节点i与主题社区l的归属强度,表示将节点i具有最大归属强度的社区序号赋值给p,则有cp=cp U{vi}。;
且对于任意一个社区ci,根据W对应的列向量Wi获取该社区关联的主题特征词。
2.根据权利要求1所述的方法,其特征在于,用于表示用户节点vi在特征词tj的取值yji,其取值采用经典的词袋模型TF/IDF进行计算,即有:yji=fjilogn/nj,其中fji为特征词tj在用户节点vi内容文档中出现的次数,nj为包含特征词tj的用户节点数量。
3.根据权利要求1所述的方法,其特征在于,所述步骤4中通过将最小化目标函数J(H,S,W)转化为典型的受限约束求极值问题,应用拉格朗日乘数方法进行求解,其具体操作过程为:
(1)构建J(H,S,W)的拉格朗日乘数函数L为:
L=J(H,S,W)+tr(αHT)+tr(βST)+tr(λWT),
其中α=[αij]n×k、β=[βpq]k×k和λ=[λab]m×k分别为H,S和W对应的拉格朗日乘数;
(2)引入Karush-Kuhn-Tucker条件,计算:
(3)令以及根据KKT平滑条件,有hijαij=0,spqβpq=0,wabλab=0,则能够分别获得H,S以及W的乘性迭代求解规则为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院;华南师范大学,未经仲恺农业工程学院;华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610059166.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:变压器的电池形接头
- 下一篇:用于存储企业产品关键数据的数据库建立方法