[发明专利]恶意用户检测方法及装置在审
申请号: | 201610080571.X | 申请日: | 2016-02-04 |
公开(公告)号: | CN105677900A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 王有权;曹杰;潘迪;陶海成;朱桂祥 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 用户 检测 方法 装置 | ||
1.一种恶意用户检测方法,其特征在于,所述方法包括:
将各恶意用户注入到推荐系统中,生成正例数据集合,所述正例数据集 合中的每个正例数据包括一组行为特征,所述一组行为特征构成一组向量;
对多组所述向量进行离散化处理;
根据所述离散化处理的结果,从所述推荐系统中的无标记用户中获取可靠 反例用户,生成反例数据集合;
将所述正例数据集合和所述反例数据集合构成标记数据集,将所述无标记 用户中获取反例用户后的剩余用户构成无标记数据集,根据所述标记数据集 和所述无标记数据集,获取推荐系统中的恶意用户。
2.根据权利要求1所述的方法,其特征在于,所述恶意用户具体包括: 随机注入、平均注入、流行随机注入、流行平均注入、混合随机流行注入、 混合平均流行注入。
3.根据权利要求1所述的方法,其特征在于,所述一组行为特征具体包 括:熵、与近邻的平均相似度、长度变化、用户评过分项目与其平均值之间 的平均偏差、用户评最高分的项目集合与其他评分项目集合的偏差、用户模 型评过分项目与其平均值之间的二阶矩、用户模型对目标项目的关注度、流 行排序、所有用户的平均距离、分类熵。
4.根据权利要求2所述的方法,其特征在于,利用公式
其中,PopRank为流行排序,Ij为所有为商品j打分的用户集合,Ri. 为用户ui所有评过分的商品集合,|R.j|为对项目Ij打过分的所有用户的个 数,|Ri.|为用户ui所有打过分商品的个数。
5.根据权利要求2所述的方法,其特征在于,利用计算所述所有用户的平均距离;
其中,DistAvg为与所有用户的平均距离,N为所有用户个数,PCCij为用户ui和用户uj的皮尔逊相关系数。
6.根据权利要求2所述的方法,其特征在于,利用计算所述分类熵;
其中,CatEnt为分类熵,Sig为用户ui所评分商品中属于类别g的个数, 1≤g≤G,G为商品类别总个数,S为用户ui所评商品的总个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610080571.X/1.html,转载请声明来源钻瓜专利网。