[发明专利]恶意用户检测方法及装置在审
申请号: | 201610080571.X | 申请日: | 2016-02-04 |
公开(公告)号: | CN105677900A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 王有权;曹杰;潘迪;陶海成;朱桂祥 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 用户 检测 方法 装置 | ||
技术领域
本发明涉及数据挖掘领域,尤其涉及一种推荐系统中的恶意用户检测方 法及装置。
背景技术
推荐系统(英文:RecommenderSystems,缩写:RS)是一种为用户提供 建议的智能化软件工具,目前已被应用于电子商务、电影和视频网站、社交 网络、个性化阅读以及广告等诸多领域。
产品的评分越来越影响用户对产品的选择,高质量的正向评分无疑会为 商家带来很多的经济收益;相反的,低评分则将给商家带来经济损失。基于 这一商业目的,有些商家为了促进产品的销售或打压其他商家的信誉,将会 雇佣大量的用户来为自己的产品打高分,同时给其他商家的产品低评分。目 前国内已出现了通过指导恶意用户以促进特定产品销售或打压其他产品信誉 来获利的网站,如“刷客网”。
在诸多的电子商务推荐系统中,协同过滤推荐算法是应用最为广泛的推 荐系统算法。目前,国内外著名的推荐系统大多都是基于协同过滤推荐算法 的,如亚马逊(英文:Amazon)网络书店、GroupLens、TiVo、Netflix、YouTube 和Facebook等。基于协同过滤推荐算法的推荐方法大多基于用户-项目矩阵(英 文:User-ItemMatrix)进行推荐,该算法的优点是可对多种类型的资源进行过 滤,并能为用户发现新的感兴趣的信息,其核心思想是通过找到与目标用户 Ut最相似的k个相似用户,根据k个相似用户对项目Ii的评分预测Ut对项目 Ii的评分。但该算法给恶意用户可乘之机,这些恶意用户通过伪造出与目标用 户Ut相似的评分向量,就能影响Ut的预测评分,恶意用户实施的这种攻击称 为托攻击(英文:shillingattack)。
为了解决这一问题,国内外学者进行了大量工作。目前大多的方法是: 首先总结用户异于正常用户的行为特征,然后基于这些行为特征构造分类器 来检测这些恶意用户。其中最为典型的算法是美国DePaul大学Mobasher, Burke和Williams等学者系统定义了恶意用户检测指标,并提出了平均、随机、 分段、流行和Love/Hate五种攻击类型,并基于C4.5决策树检测这些恶意用 户。国内国防科技大学的李聪在其博士论文中从恶意用户行为特征的群体效 应作为切入点,构建了定量度量和相应的遗传优化目标函数来实现恶意用户 检测。华南大学的陈健等人在其专利《一种基于兴趣组合的协作推荐攻击检 测系统及方法》提出了基于用户兴趣组合挖掘模块的聚类分析方法检测恶意 用户。上述方法通过捕捉恶意用户的异常行为成功的检测出了大量的恶意用 户。但现实中,为了逃脱已有算法的检测,恶意用户通常将其评分方式接近 于正常用户,目前的推荐系统恶意用户检测方法难以有效地检测这些用户。 如以亚马逊上的某一用户“chen---yanyan”为例,在其评论的商品中,其写了大 量的有用评论,并且购买了大量的商品,表面上看来其属于正常用户,但仔 细分析其评分的商品,可发现其所评分的所有商品均来自于同一商家“北京紫 图图书有限公司”,因此有理由确认该用户是该公司的枪手。现实的推荐系统 中,往往存在大量的无标记用户(推荐系统真实存在的用户,不通过检测无法 判读其是正常用户或恶意用户)和少量的标记用户(即人工判别出的恶意用 户),由于标记数据很少,如果直接用基于特征分类器,则检测效果不佳。
发明内容
本发明的目的是解决现有的推荐系统恶意用户检测方法效果不佳的问 题,通过基于正例和无标记(英文:PositiveandUnlabeled,缩写:PU)学习 方法来检测多种恶意用户检测,其中P表示注入的恶意用户,而U表示无标 记的推荐系统数据,并提出了一种新颖的反例用户(英文:Negative,即异于正 例用户行为特征的用户)数据抽取方法;其次,本发明提出的混合学习方法在 集成Beyesian模型的基础上,将在恶意用户行为特征的基础上将用户-商品关 系集成到该传统机器学习算法中,以检测隐藏更深的恶意用户;最后在抽取 可靠反例用户的基础上,基于半监督学习来检测恶意用户,更好的利用标记 数据和无标记数据,并通过实验验证了其有效性。
第一方面,本发明实施例提供了一种恶意用户检测方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610080571.X/2.html,转载请声明来源钻瓜专利网。