[发明专利]一种基于图计算的可信社交关系分析方法在审
| 申请号: | 201810385952.8 | 申请日: | 2018-04-26 | 
| 公开(公告)号: | CN108765179A | 公开(公告)日: | 2018-11-06 | 
| 发明(设计)人: | 庞韶敏;于芳名;万腾峰;黄煜恒;闭雨哲;杨振新;王嘉康;金红;刘长永;杨满智;蔡琳 | 申请(专利权)人: | 恒安嘉新(北京)科技股份公司 | 
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06Q10/06;G06F17/30 | 
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 | 
| 地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 图计算 社交关系 社交网络 可信 结点 社区 检测算法 可信关系 属性特征 原始数据 结合子 出度 入度 分析 搜集 筛选 检测 | ||
1.一种基于图计算的可信社交关系分析方法,其特征在于,所述方法包括:
步骤S1,搜集社交网络原始数据,建立图计算模型;
步骤S2,采用社区检测算法将所述图计算模型分成若干子图社区,并计算子图社区结点的大小;
步骤S3,根据图计算模型,计算每个结点包含三角计数、入度、出度在内的属性特征,并结合子图社区结点大小,判断并筛选出该社交网络中为可信社交关系的用户名单。
2.如权利要求1所述的可信社交关系分析方法,其特征在于,所述步骤S1中,建立图计算模型的过程具体包括:
根据用户之间是否存在直接的社交联系,将不同的用户分成发起方用户和接收方用户,每个用户分别作为一个结点;
当发起方用户至接收方用户建立社交联系时,建立从发起方用户所在的结点指向接收方用户所在结点的的一条有向边;
根据建立的多个有向边,构建呈网络结构分布的所述图计算模型。
3.如权利要求2所述的可信社交关系分析方法,其特征在于,分成若干子图社区的过程具体包括如下:
计算该社交网络中所有边的介数;
找到介数最大的边,将其从网络中移除;
重复计算该社交网络中剩余边的介数,最后当达到最大迭代次数时,算法停止。
4.如权利要求2所述的可信社交关系分析方法,其特征在于,在所述步骤S3中,判断并筛选出该社交网络中为可信社交关系的用户名单具体包括:
根据计算的结点的属性特征及结点数量,计算该子图社区的相关系数,并判断相关系数是否大于设定的阈值,如低于设定的阈值,则判定为可信的社交关系,如否,则丢弃。
5.如权利要求1所述的可信社交关系分析方法,其特征在于,在所述步骤S1中,还包括对搜集的社交网络原始数据进行数据清洗和过滤,筛选出有效字段信息。
6.如权利要求4所述的可信社交关系分析方法,其特征在于,所述相关系数的计算方法为:
根据熵值法确定社区中的四个属性分别对应的权重α,β,γ,ε;
将入度与三角形个数、出度与三角形个数、社区结点与三角形个数分别利用皮尔逊公式求得相关系数;最后的相关系数为R=(α+γ)*corr(inDeg,TriC)+(β+γ)*corr(outDeg,TriC)+(ε+γ)*corr(CommVerC,TriC),其中,inDeg表示入度,TriC表示三角个数,outDeg表示出度,CommVerC表示社区结点。
7.如权利要求1所述的可信社交关系分析方法,其特征在于,所述社区检测算法为GN算法。
8.如权利要求1所述的可信社交关系分析方法,其特征在于,所述社交网络原始数据包括:用户的通话数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒安嘉新(北京)科技股份公司,未经恒安嘉新(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810385952.8/1.html,转载请声明来源钻瓜专利网。





