[发明专利]基于维特比算法的多社交网络账号匹配方法在审
申请号: | 201910707360.8 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110413900A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 费高雷;何鹏涛;胡光岷 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交网络 维特比算法 匹配 匹配结果 时间复杂度 属性相似度 加速效果 快速构建 目标函数 匹配技术 匹配算法 匹配用户 社交账号 属性特征 最优路径 最终结果 歧义 求解 算法 重构 篱笆 搜索 集合 概率 引入 网络 | ||
本发明提供了一种基于维特比算法的多社交网络账号匹配方法,属于社交网络账号匹配技术领域。本发明首先通过社交网络的搜索快速构建待匹配用户集合,极大的减少了待匹配社交账号的数量;然后,以账号间用户名的相似概率为边权重构建篱笆网络,通过维特比算法求解最优路径,即得到符合目标函数的初步匹配结果,采用维特比算法可降低多社交网络账号匹配算法的时间复杂度,算法加速效果明显;最后,引入其他属性特征对初步匹配结果进行精确匹配,解决初步匹配结果中用户名相同出现歧义的情况,对于用户名相同的账号,可以得到其他属性相似度最大的账号作为最终结果。
技术领域
本发明属于社交网络账号匹配技术领域,特别涉及一种基于维特比算法的多社交网络账号匹配方法。
背景技术
随着网络技术的发展,社会已经进入了web2.0时代,各种互联网应用层出不穷。社交网络作为网络应用中的佼佼者,在极大的丰富了人们的生活的同时,也成为了一个蕴含大量信息的数据库。社交网络中的信息也成为了改变人们生活的原动力,但同时社交网络中的信息也存在着隔离性和不完整等特点。同一个用户会在不同的网络应用中注册多个不同账号,而且可能提供的身份信息不一致。识别不同的社交媒体账号是否属于同一人物实体,对于人物属性融合以及个人信息挖掘有着重要的意义。
跨社交媒体的账号匹配问题通常被建模为一个分类问题:给定两个账号a、b分别属于社交媒体平台A和B,研究的目的就是获得一个分类判别函数,当输入输入账户a和b的信息后,如果两个账户属于同一人物实体则输出1,否则输出0。
通过社交媒体用户识别分辨出不同社交网络中属于同一个人的账号,构建相对完整的人物信息画像,在商业应用、信息检索、网络空间安全等许多领域都具有重大的研究意义与实用价值。
网络空间治安管理。随着社交网络的广泛普及与飞速发展,一些不法分子也会借助这个信息传播平台,同时在不同的社交网站上注册多个账号,针对不同网站提供的各类行为接口,进行例如欺诈、钓鱼、隐私窃取等恶意行为和非法活动,甚至是谋划恐怖袭击。通过社交媒体用户识别技术,国家可以更好地进行网络空间治安管理,及时制止违法犯罪行为的发生,保护合法用户的权益与安全。
个性化服务推荐。在商业领域,商家希望尽可能多的掌握关于潜在顾客的购物需求与喜好方面的信息,从而可以进行有效的推销活动,实现利益最大化,推荐系统就是应此需求而产生的。商家可以从多个社交网站中搜集出潜在客户的所有网络账号,给每个用户构建一个综合性的、全面完整的个人资料档案,为推荐系统建立一个更好的用户兴趣模型,从而就能够及时地、准确地向用户推送他们最感兴趣的商品和服务,以此来实现营销利益最大化。
社交网络数据挖掘。社交网络数据挖掘研究综合了计算机技术、互联网技术、复杂网络理论、传播学等多个学科的研究方法,成为了一门新兴的交叉学科。将多个社交网络关联起来进行数据挖掘,有时可能会展现出单独观察一个网络时所不能看到的有趣的现象,获取更多有价值的信息。除此之外,从另一个角度来讲,由于利用网络的各种属性,可以不经过用户允许就挖掘出其在各个网络中的身份信息,造成用户隐私的泄露,人们应当从中学会如何隐藏自己的身份信息,从而保护自己的人身和财产安全。
现有的社交媒体用户识别方法大都关注于两个社交网络之间账号的识别,而对于三个或三个以上的社交网络账号的识别鲜有研究。同时社交网络账号识别算法在存在着待匹配账号数量巨大,算法时间复杂度过高的问题。两个社交网络账号进行匹配的时候,会将账号相似度最大的一对账号作为正确结果。但这种匹配策略使用到三个或三个以上的社交网络的时候会出现以下匹配不合理的问题。对于社交网络A和B,最优匹配结果是a和b。对于社交网络A和C,最优匹配结果是a和c。这时对于社交网络B和C,属于同一个人的账号应该为b和c。但是实际上,社交账号b和c并不属于同一个人,而且b和c的相似度极低。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910707360.8/2.html,转载请声明来源钻瓜专利网。