[发明专利]海量用户的二度人脉关系MapReduce推荐方法及系统有效
申请号: | 201310704592.0 | 申请日: | 2013-12-18 |
公开(公告)号: | CN103714135B | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 张延凤;张霞;赵立军;任英杰 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿元知识产权代理有限公司11327 | 代理人: | 陈英俊 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 海量 用户 二度 人脉 关系 mapreduce 推荐 方法 系统 | ||
技术领域
本发明涉及海量用户人脉关系技术领域,更为具体地,涉及一种海量用户的二度人脉关系MapReduce推荐方法及系统。
背景技术
随着SNS(Social Networking Services,社会性网络服务)社区的兴起,海量的用户关注关系已经产生。SNS社区拥有的海量用户关注关系,是一笔宝贵的数据财富,如何把用户的一度人脉转化为价值是SNS社区面临的问题。同时在SNS社区运营过程中,一度人脉趋于稳定,基于海量用户的一度人脉关系,分析用户的二度人脉关系,结合SNS社区的垂直业务,开发出更加有竞争力的应用。这样既可以给用户带来新鲜感,引导用户加深对用户二度人脉的认识,又可以延长用户使用社区的粘性,延长用户使用社区的时间,为社区带来更多的流量和利润,使用户与价值得到统一和转化。
面对用户的关注关系,挖掘用户的二度人脉是社区需要解决的问题,图1示出了现有处理用户的二度人脉的流程,如图1所示,
S110:开始;
S120:海量用户关注关系,A---B,B---C;
S130:查找用户A关注的用户集合SET1;
S140:查询用户结合SET1的关注者集合SET2;
S150:SET2中去掉用户A已经关注的用户;
S160:用户A的二度人脉关系集合即为SET2;
S170:统计二度人脉的间接推荐次数;
S180:结束。
面对海量用户数据量的计算,通常采用的处理手法就是并行计算。上述图1的处理方法存在反复查询的情况,如:用户A和用户B都关注了用户C,则在计算用户A和用户B的二度人脉时,C都是间接关注,都需要去查询用户C的关注者。反复的查询导致并行计算的效率并不能并行提高,处理效率也很低。
SNS社区在计算二度人脉关系时,不仅仅需要提高大数据计算的效率,同时在进行二度人脉关系推荐时,一度人脉需要考虑推荐权重;若一度人脉的粉丝数目比较多、用户比较活跃,则一度人脉的推荐权重应该相应的提高。
为了解决上述的问题,需要提供一种新的计算方法,避免重复查询,提高处理效率;同时在考虑一度人脉关系的时候,综合考虑一度人脉的粉丝数、活跃度,给予相应的二度人脉推荐权重。
发明内容
鉴于上述问题,本发明的目的是提供一种海量用户的二度人脉关系MapReduce推荐方法及系统,以解决重复查询、推荐准确性和提高计算效率的问题。
根据本发明的一方面,提供一种海量用户的二度人脉关系MapReduce推荐方法,在海量用户的关注关系中,根据用户的一度人脉关系通过两步MapReduce的计算方法获得用户的二度人脉关系,并予以推荐;其中,
在海量用户的关注关系中,若用户A关注用户B,用户C关注用户A,则用户B为用户A的好友,用户C为用户A的粉丝;并且,若用户C通过用户A推荐关注用户B,则用户B为用户C的二度人脉,用户A为用户C和用户B之间的间接关注者;用户C通过在海量用户的关注关系中的除用户A的其他用户关注用户B,则其他用户为用户C和用户B的间接关注者;并且,
在两步MapReduce的计算方法中的第一步MapReduce的计算方法中,在海量用户的关注关系中,根据用户A的一度人脉,将用户A的好友与用户A的粉丝合并归类,获得用户A的好友集合和用户A的粉丝集合,同时并统计用户A的粉丝的数量;其中,
用户B在用户A的好友集合中,用户C在用户A的粉丝集合中;并且,
在海量用户的关注关系中,根据其他用户的一度人脉,获得其他用户的好友集合和其他的用户的粉丝集合,同时并统计其他用户的粉丝数量;
在两步MapReduce的计算方法中的第二步MapReduce的计算方法中,在海量用户的关注关系中,用户A的粉丝集合通过用户A推荐关注用户A的好友集合,用户A的粉丝集合的二度人脉为用户A的好友集合,其中,用户A为用户A的粉丝集合中的用户C和用户A的好友集中的用户B的间接关注者;并且,
根据用户A的粉丝的数量获得用户A的推荐权重值,根据其他用户的粉丝的数量获得其他用户的推荐权重值;
将用户A的推荐权重值和其他用户的推荐权重值进行合并从而获得最大的推荐权重值,并统计用户C和用户B之间的间接关注者的数量,其中,用户C和用户B之间的间接关注者的数量为用户A和其他用户的数量之和;
将用户B推荐给所述用户C,同时将最大的推荐权重值以及所有间接关注者推荐给用户C,以完成用户的二度人脉关系推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310704592.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种设有基准定位座的后桥装配检具
- 下一篇:电池接触片下陷检测装置