[发明专利]一种基于随机游走度惩罚机制的社交网络好友预测方法在审
申请号: | 202010893847.2 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112132326A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 杨旭华;马钢峰;许营坤;叶蕾 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06K9/62;G06F16/9536 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 游走 惩罚 机制 社交 网络 好友 预测 方法 | ||
一种基于随机游走度惩罚机制的社交网络好友预测方法,基于社交网络用户数据构建社交网络模型,通过改变随机游走采样概率来获得游走序列,在随机游走序列中依次选取用户,作为当前用户,设定滑动窗口,从中依次选取用户,作为训练的正样本,通过函数获得负采样集合,在利用节点与负样本嵌入的当前相似度作为负采样概率指标,得到训练的负样本,使用损失函数做损失。所得到的嵌入向量做内积,即为用户之间的相似度,相似度较高的即为预测的好友。本发明考虑了用户度大小以及当前的嵌入向量表示,提高了好友预测的准确性。
技术领域
本发明涉及社交网络预测领域,特别是指一种基于随机游走度惩罚机制的社交网络好友预测方法。
背景技术
由于网络技术的飞速发展,如今,互联网早已惠及人们生活、工作、学习等各个方面。线上社交逐渐变得不可忽视,在社会交流中占据了较大的比重。网络中的用户以及用户之间的联系形成了庞大的社交网络。为用户推荐可能认识的好友或潜在的相似好友,对于补全社交网络以及促进用户交流,具有非常大的实际价值和研究价值。
网络表征学习旨在将离散数据映射为连续低维向量表征。作为一种无监督的网络学习算法,十分适合社交网络数据。表征学习所得到的用户低维向量具有一定的意义:向量的每一维数字表示都隐藏着该用户的一些特征信息,向量之间的相似性比较也可以很好地反映用户之间的相似度,为用户推荐提供了依据。因此,将社交网络的结构信息,嵌入到低维空间向量能很好地对用户关系进行存储和分析。
然而,如何学习得到可信赖的,表达能力强的用户向量表征仍是一个难点问题。主流的网络表征方法存在内存占用较大或时间复杂度较高的问题。
发明内容
为了克服传统的社交网络方法预测好友精确度不高的问题,本发明提出一种通过提升用户向量表征来提高好友预测性能的基于随机游走度惩罚机制的社交网络好友预测方法,考虑了用户度大小对随机游走的影响,实现自适应的负采样,使用浅层网络,提出了一种基于度惩罚随机游走的社交网络好友预测方法,有效的提升了用户向量的表示性能,提升了社交网络好友预测的准确度。
本发明解决其技术问题所采用的技术方案是:
一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,得到随机游走节点序列
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
其中负采样集合Nneg为不在随机游走序列L下的节点集合,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010893847.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理