[发明专利]基于熵权法的跨社交网络用户身份匹配方法、介质及装置在审
申请号: | 202210971332.9 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115048563A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 饶志宏;王莉莉;康荣保;张晓;赵尔凡;杜艳霞 | 申请(专利权)人: | 中国电子科技集团公司第三十研究所 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9536;G06F16/955;G06K9/62 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 舒盛 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 熵权法 社交 网络 用户 身份 匹配 方法 介质 装置 | ||
本发明提供一种基于熵权法的跨社交网络用户身份匹配方法、介质及装置,所述方法包括如下步骤:S10,数据收集:采集多个社交网络的用户属性信息;S20,特征提取和融合:基于用户属性信息提取并融合用户属性特征;S30,相似度计算:计算两用户不同属性特征的相似度;S40,身份匹配:利用熵权法为两用户不同属性分配权重,基于两用户不同属性特征的相似度以及权重计算两用户的总体相似度;S50,输出结果:根据两用户的总体相似度判断两用户是否身份匹配。本发明通过多维度的信息融合与分析方法来匹配用户身份,提升了用户身份匹配效果。
技术领域
本发明涉及社交网络技术领域,具体而言,涉及一种基于熵权法的跨社交网络用户身份匹配方法、介质及装置。
背景技术
社交网络是人们通过互联网进行联系和互动的便捷方式,如美国的Facebook、Twitter、Instagram,以及我国的微博和人人网等。社交网络提供的服务越来越丰富,包括文本信息发布、图像与视频共享、用户间关注、用户评论等。人们在不同社交网络上的行为活动侧重点不同,如新浪微博以媒体属性为主,人人网以社交属性为主。越来越多的用户注册不同的社交网络,以获得不同的服务,这给构建一个完整的用户画像带来了极大的困难。跨社交网络中用户身份匹配是实现用户完整画像构建的前提。
跨社交网络用户身份匹配主要是判断不同社交网络平台上的用户是否对应同一个实体用户。目前的跨社交网络用户身份匹配技术大致可以分为基于用户属性的身份匹配、基于用户关系的身份匹配、基于用户生成内容(User Generated Content, UGC)的身份匹配和基于综合属性的身份匹配。
基于用户属性的身份匹配技术主要通过计算用户的属性(用户名、用户头像、用户位置、性别、年龄、教育程度、职业等)相似度进行匹配。在大型社交网络中用户属性存在较大的重复性,且多数社交网络对用户属性信息设定为隐私数据,单纯依靠用户属性方法无法解决大型社交网络用户身份匹配问题。
基于UGC的身份匹配技术主要通过计算用户发布的内容(位置、时间、文本等)相似度,提取两个社交网络内容相似度、时间相似度和空间相似度等特征,采用机器学习方法对用户身份进行匹配。然而,许多用户的生成内容设置为“不可见”,这也给用户身份匹配带来了困难。
基于用户关系的身份匹配技术目前研究还不多,相较于用户属性信息,用户关系中涵盖的虚假信息量更少。目前,基于用户关系的身份匹配方法有两种:一种是有先验节点的身份匹配方法,另一种是无先验节点的用户匹配方法。有先验节点的用户匹配方法主要在已知部分先验用户(已匹配的用户对)的前提下,通过建立用户相似度模型,来迭代匹配新的用户对。有先验节点的用户匹配方法的关键是需要找到高质量的“种子用户”,当前用户越来越重视隐私保护,如何找到高质量的“种子用户”是该研究的一个重点问题。无先验节点的身份匹配方法认为相同用户在不同的社交网络上具有类似的好友关系,在无需高质量的用户关系对的情况下,可以通过用户关系结构来计算相似度。该方法普适度高,但实现难度更大。
除了单纯使用用户属性信息、UGC信息和与用户关系信息之外,还有一些研究致力于综合运用这些信息来提升用户身份匹配效果。基于综合属性的身份匹配方法综合运用用户属性信息、用户发布的内容以及用户关系,充分考虑用户的动态变化,对用户的兴趣进行建模分析,对用户身份进行匹配。这种综合运用了属性、关系和UGC等各种维度信息的身份匹配方法,能够实现更好的匹配效果,但由于多维度信息的融合建模技术难度较高,目前这种身份匹配方法的研究尚处于起步阶段。
发明内容
本发明旨在提供一种基于熵权法的跨社交网络用户身份匹配方法、介质及装置,以解决目前跨社交网络用户身份匹配难度大、效果不佳的问题。
本发明提供的一种基于熵权法的跨社交网络用户身份匹配方法,包括如下步骤:
S10,数据收集:采集多个社交网络的用户属性信息;
S20,特征提取和融合:基于用户属性信息提取并融合用户属性特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210971332.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机械设备用永磁节能电动机
- 下一篇:一种晶体管及其制备方法