[发明专利]一种基于社交平台的人脉分析方法及系统在审
| 申请号: | 201911394673.9 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111177583A | 公开(公告)日: | 2020-05-19 |
| 发明(设计)人: | 秦树伟;田立娜;高军;王可鑫;段文良 | 申请(专利权)人: | 山东合天智汇信息技术有限公司;秦树伟 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
| 地址: | 250000 山东省济南市高新区舜华路1*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 社交 平台 人脉 分析 方法 系统 | ||
本发明公开了一种基于社交平台的人脉关系分析方法及系统,所述方法包括以下步骤:从社交平台获取目标用户群体的个人信息和社交信息;基于所述个人信息和社交信息,获取所述目标用户群体中用户的多种人脉关系信息;根据所述目标用户群体中用户的多种人脉关系信息,构建人脉关系网络。本发明能够基于复杂的社交网络数据,快速挖掘目标用户的各类人脉关系并进行量化。
技术领域
本发明属于互联网数据挖掘技术领域,尤其涉及一种基于社交平台的人脉分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
社交网络涵盖以人类社交为核心的所有网络服务形式,互联网是一个能够相互交流,相互沟通,相互参与的互动平台。另外,互联网的快速发展也促进了社会的透明度,在各个论坛及博客中都能够查到人们在网络中的活动信息。
但是,在混乱复杂的互联网数据中快速挖掘出社交人脉好友非常困难。目前基于Facebook、LinkedIn等网络论坛只能查找用户的基本信息、发帖信息、好友信息及家乡、居住地、现居住、教育经历、工作经历等信息,但查找到的用户个人信息之间并没有直接的关系,而每个人在论坛中展示的内容及方式也各不相同。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于社交平台的人脉关系分析方法及系统,能够基于复杂的社交网络数据,快速挖掘目标用户的各类人脉关系并进行量化。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
一种基于社交平台的人脉关系分析方法,包括以下步骤:
从社交平台获取目标用户群体的个人信息和社交信息;
基于所述个人信息和社交信息,获取所述目标用户群体中用户的多种人脉关系信息;
根据所述目标用户群体中用户的多种人脉关系信息,构建人脉关系网络。
进一步地,所述个人信息包括身份信息和简历信息;所述社交信息包括该用户的在社交平台上的好友信息和网络轨迹行为数据信息。
进一步地,所述多种人脉关系包括亲戚关系、校友关系、同事关系、近邻关系、重要人脉关系和涉华好友关系。
进一步地,获取所述目标用户群体中用户的多种人脉关系信息包括:
通过对比两个用户之间的教育经历或工作经历,判断是否存在校友关系或同事关系;
根据两个用户之间出生地/现居地的地理位置远近,判断是否存在近邻关系;根据两个用户之间出生地地理位置的远近,用户个人信息中所公布的亲戚信息,以及社交信息,确定用户之间是否存在亲戚关系;
根据两个用户所从事的工作职位及描述,和所关注的关键词进行匹配,确定是否存在重要人脉关系;其中,所述匹配基于预先构建的关注对象关键词库,若匹配得到的关键词个数大于设定值,说明存在重要人脉关系。
进一步地,获取所述目标用户群体中用户的多种人脉关系信息后,还预测用户之间的亲密度,所述亲密度预测方法包括:
基于预先划分的多种人脉关系相应的等级和权重,对步获取的人脉关系进行量化;
基于亲密度预测模型,对用户之间的亲密度进行预测。
进一步地,所述亲密度预测模型的建立方法包括:
采集监督样本数据,所述监督样本数据涵盖多种人脉关系的用户;
对监督样本数据中用户之间的人脉关系进行量化,并赋予亲密度值;
将亲密度值大于设定值的样本数据记为正例,其他样本数据记为负例,基于逻辑回归模型建立亲密度预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东合天智汇信息技术有限公司;秦树伟,未经山东合天智汇信息技术有限公司;秦树伟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911394673.9/2.html,转载请声明来源钻瓜专利网。





