[发明专利]一种社交网络推荐系统及方法有效
申请号: | 201310097930.9 | 申请日: | 2013-03-25 |
公开(公告)号: | CN104077723B | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 陆平;罗圣美;胡磊;王桥;林云龙;邹俊洋;钟齐炜;陆建 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 田红娟,龙洪 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 推荐 系统 方法 | ||
技术领域
本发明涉及数据挖掘和网络技术领域,尤其涉及一种社交网络推荐系统及方法。
背景技术
近年来,社交网络迅速崛起,极大的改变了人们的工作和生活。社交网络可以便捷的共享个人和专业信息,例如兴趣爱好,技术领域等,并且提供多样化的沟通方式,例如关注,评论,转发等。这些行为一方面使得网络数据的激增,这些规模巨大的数据背后隐藏着许多有价值的信息;另一方面在社交网络中构成了社区结构,社区内部的用户之间关系紧密,社区之间的关系则较为稀疏。
同时,推荐系统已经广泛的运用于各种领域,诸如电子商务,社交网络等都不同程度的使用了各种形式的推荐系统。其中,常用的协同过滤技术尤其适合应用在文化产品上,例如推荐音乐,电影等。但是协同过滤技术也同样存在着很多局限性:如冷启动问题,评分矩阵稀疏问题,可扩展性问题等等,这些都成为制约推荐系统实施的重要因素。提高推荐的及时性和准确性一直是推荐系统研究的热点和难点。
许多研究工作已经取得了一定的效果,但仍然没能很好的综合处理社交网络场景下的推荐问题。比如:社交网络中数据集的快速获取问题、合理的链接强度的计算问题、对大数据集的并行化处理问题、数据分析与推荐的及时性和准确性问题、流量和存储空间的有效利用问题等等。
发明内容
本发明所要解决的技术问题是,提供一种社交网络推荐系统及方法,保证对大规模数据集推荐的高效性、可靠性和及时性。
为了解决上述技术问题,本发明公开了一种社交网络推荐系统,其包括:
并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息,并存储所获取的数据集;
用户间链接强度计算模块,基于所述并行数据获取模块所获取的用户间的交互信息进行用户间的链接强度的并行计算;
并行化社区发现模块,根据所述用户间链接强度计算模块计算出的用户间的链接强度,结合相应的聚类算法,对并行数据获取模块所获取的数据集实现并行化的社区发现;
基于社区发现结果的潜在信息分析与推荐模块,在并行化社区发现模块社区发现结果的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。
较佳地,上述系统中,所述必要的社交网络数据包括如下任一种或几种:
用户信息、关注列表、粉丝列表、@信息、话题信息、标签信息、博文消息列表与评论列表。
较佳地,上述系统中,所述用户间链接强度计算模块进行用户间的链接强度的并行计算的过程如下:
对所述并行数据获取模块所获取的整个数据集中的用户ID进行取模运算,得到的模数为集群计算节点数;
根据计算得到的各用户对应的模值,将用户数据分割到对应的计算节点,并行计算用户间的链接强度。
较佳地,上述系统中,所述用户间链接强度计算模块按照如下公式计算用户间的链接强度wij:
其中,wij为用户i与用户j间的链接强度,rq(q=1,2,3)分别表示用户i与用户j之间的好友关系,用户i与用户j之间@的次数以及用户i与用户j之间评论的次数,kq表示用户i与用户j之间的各种交互信息的权重。
较佳地,上述系统中,所述并行化社区发现模块根据所述用户间链接强度计算模块计算出的用户间的链接强度,结合相应的聚类算法,对并行数据获取模块所获取的数据集实现并行化的社区发现指:
将并行计算的用户间的链接强度组成的邻接矩阵分割到各个计算节点上,并行计算其度矩阵和Laplacian矩阵;
对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值和对应的特征向量;
将得到的特征向量排成一行,构造出特征向量矩阵U,并对其行归一化,得到规范化特征向量矩阵Y;
再对规范化的特征向量矩阵Y进行特征提取,将每行看作一个点,代表原来的抽象个体的欧式空间映射,采用基于距离的聚类方法将其聚类成K类;
根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。
本发明还公开了一种社交网络推荐方法,包括:
并行获取必要的社交网络数据,实时获取用户间的交互信息,并存储所获取的数据集;
基于所获取的用户间的交互信息进行用户间的链接强度的并行计算;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310097930.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:预混式液压伸缩的燃烧装置及其方法
- 下一篇:具有自动接线功能的线放电加工机