[发明专利]一种面向在线社交网络的主题社区挖掘方法有效
申请号: | 201610059166.X | 申请日: | 2016-01-28 |
公开(公告)号: | CN105760426B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 贺超波;汤庸;刘海;陈国华;付志文;杨灵;张世龙 | 申请(专利权)人: | 仲恺农业工程学院;华南师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510220 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 在线 社交 网络 主题 社区 挖掘 方法 | ||
本发明提出一种面向在线社交网络的主题社区挖掘方法,该方法是基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的主题社区挖掘方法,可以通过NMF模型统一集成用户节点链接和内容信息,并应用矩阵近似分解方法得到用户节点与社区之间的归属关系矩阵以及各社区与主题特征词之间的关联强度矩阵,从而可以利用分解矩阵信息直接挖掘主题社区。该方法不仅可以采用统一模型处理用户节点的链接和内容两类信息,而且挖掘过程更加简单有效,具备更好的挖掘质量,因此更适合实际应用于挖掘在线社交网络存在的主题社区。
技术领域
本发明涉及在线社交网络服务技术领域,更具体的,涉及一种面向在线社交网络的主题社区挖掘方法。
背景技术
在线社交网络的主题社区挖掘不同于传统的只基于用户节点链接信息的社区挖掘,它综合考虑了用户节点的链接以及内容信息,从而可以获得成员节点链接紧密而且主题特征相似的社区。主题社区的挖掘结果在现实中更具有应用价值,例如可以为在线社交网络群体行为监测、舆情分析、电子商务运营商进行精准社会化营销以及广告投放等提供有力支持。
目前主题社区挖掘已成为在线社交网络社区挖掘问题新的研究热点,研究人员提出了一些具有代表性的方法,其中包括基于距离相似度计算的SACluster方法,基于概率模型的BAGC、LCTA、SNLDA方法以及基于图聚类模型的CODICIL方法等。总的来说,上述主题社区挖掘方法都存在如下问题:对用户节点链接信息和内容信息需要分别设计不同模型处理,社区挖掘过程需要划分多个阶段,从而造成挖掘过程过于复杂,并不适合实际应用。因此,现有主题社区挖掘方法仍有不断改善的空间,需要设计一种更加有效的方法。
发明内容
本发明针对现有方法存在的问题,提出一种面向在线社交网络的主题社区挖掘方法,该方法是基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的主题社区挖掘方法,可以通过NMF模型统一集成用户节点链接和内容信息,并应用矩阵近似分解方法得到用户节点与社区之间的归属关系矩阵以及各社区与主题特征词之间的关联强度矩阵,从而可以利用分解矩阵信息直接挖掘主题社区。该方法不仅可以采用统一模型处理用户节点的链接和内容两类信息,而且挖掘过程更加简单有效,具备更好的挖掘质量,因此更适合实际应用于挖掘在线社交网络存在的主题社区。
为了实现上述目的,本发明的技术方案为:
一种面向在线社交网络的主题社区挖掘方法,包括:
步骤1:形式化表示在线社交网络:
将在线社交网络形式化表示为无向图G=(V,E,T),其中V={v0,v1,...,vn-1}为用户节点集合,E={eij|vi∈V,vj∈V}为用户节点的链接边集合,T={t0,t1,...,tm-1}为主题特征词汇集合,且有n=|V|以及m=|T|;
步骤2:构建用户节点链接矩阵和主题特征词关联矩阵其中表示非负数,;
对于任意两个用户节点vi和vj,如果则X中对应的元素xij=xji=1,否则xij=xji=0;
由于能够从用户节点的内容信息中抽取出每个节点所关联的主题特征词集合,那么都能够关联一个主题特征词向量(y0i,y1i,...,y(m-1)i),其中yji用于表示用户节点vi在特征词tj的取值,所有用户节点关联的主题特征词向量计算完成后,则构成主题特征词关联矩阵Y;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院;华南师范大学,未经仲恺农业工程学院;华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610059166.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:变压器的电池形接头
- 下一篇:用于存储企业产品关键数据的数据库建立方法