[发明专利]基于SNS环境的非正常行为过滤方法及装置有效
申请号: | 201210484445.2 | 申请日: | 2012-11-23 |
公开(公告)号: | CN103838759A | 公开(公告)日: | 2014-06-04 |
发明(设计)人: | 夏立;杨含飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 sns 环境 正常 行为 过滤 方法 装置 | ||
技术领域
本申请涉及数据处理领域,尤其涉及一种基于SNS环境系统的非正常行为过滤方法及装置。
背景技术
SNS(Social Networking Services),即社会性网络服务,用户终端可以利用该服务建立一个关系网。以微博这个弱SNS关系环境为例,用户终端利用SNS建立关系网的方式简单来说就是,用户终端A作为一个行为主体可以通过加关注,加粉丝,发私信或发评论与其他用户终端产生关系,关系类型可以包括单向关注、双向关注、单向粉丝和无任何关系等。其中,与用户终端A的关系类型为单向关注、双向关注和单向粉丝的其他用户终端构成了用户终端A的关系网,而与用户终端A为无任何关系的用户终端不在用户终端A的关系网内。
在SNS环境(即可以为用户提供SNS的环境,一般是指基于SNS服务器所构建的一个可以允许用户享受SNS的环境,比如基于微博服务器所构建的允许用户发微博的SNS环境等)中,用户终端除了可以实现通过执行一系列的行为,例如加关注,加粉丝,建立自己的关系网外,还可以实现通过发私信、发评论与关系网内和关系网外的用户终端进行信息互动。通常情况下,SNS服务器可以记录每个用户终端,即每个行为主体产生的信息数据,行为数据和关系类型数据。其中,信息数据包括行为主体发出的信息主体以及各信息主体对应的接收对象的信息;行为数据包括SNS环境中的行为主体所执行的无信息主体的行为的信息(例如加关注,加好友)和行为作用对象的信息;关系类型数据包括行为主体与信息主体接收对象的关系类型,以及行为主体与行为作用对象的关系类型。
在SNS盛起的同时,也产生了一些用户通过SNS进行非正常行为信息传播,或执行非正常行为的情况,例如垃圾邮件、垃圾短信、垃圾消息等。由于基于SNS所建立的关系网的网状结构特点,在加快用户信息流动的同时,也使非正常行为信息传播更快速,非正常行为影响更广泛。
一般来讲,非正常行为信息可以包括:(1)、未经用户同意,任何以推销产品、服务、地产等为目的的广告,或者以提供投资机会或者交易机会为目的的商业信息;(2)、各种虚假、不实的信息;(3)频繁的未经请求的单方面信息,例如频繁发送的微博私信。而非正常行为则是指SNS环境系统中非正常的用户交互行为,比如频繁的加关注,加好友等。
传统的非正常行为鉴别技术一般都是通过对信息数据的信息本体进行分析,从而确定该信息数据是否为非正常行为信息,进一步确定该信息数据对应的行为主体是否为非正常行为用户。但发送非正常行为信息的行为主体可以通过不断地修改信息的文本内容来实现逃避信息被识别为非正常行为信息,从而逃脱自身被识别为非正常行为用户。可见,传统的非正常行为鉴别技术存在较大漏洞,使得传统的非正常行为鉴别技术不能彻底甄别SNS环境系统中的非正常行为,从而不能彻底实现对该些非正常行为的过滤处理。
发明内容
本申请实施例提供一种基于SNS环境的非正常行为过滤方法及装置,用以过滤SNS环境中的非正常行为。
本申请实施例采用以下技术方案:
一种基于SNS环境的非正常行为过滤方法,包括以下步骤:
服务器获得SNS服务器针对待辨识行为的行为主体所记录的行为数据、关系类型数据和包含信息本体的接收对象的信息;
根据所述信息本体的接收对象的信息,确定用于表征信息本体的接收对象分布的发散度;
根据所述信息本体的接收对象的信息和所述关系类型数据,分别确定所述行为主体的各个关系类型在所述行为主体的所有关系类型中的关系占比值;
根据所述行为数据,确定用于表征行为特征的行为参数值;
根据所述关系占比值、所述发散度以及所述行为参数值,确定所述行为主体是否执行了非正常行为;
在确定所述行为主体执行了非正常行为时,对与所述行为主体执行的非正常行为相关的指令进行过滤。
本申请实施例还提供一种基于SNS环境的非正常行为过滤装置,包括:
数据获得单元,用于获得SNS服务器针对待辨识行为的行为主体所记录的行为数据、关系类型数据和包含信息本体的接收对象的信息;
发散度确定单元,用于根据所述数据获得单元获得的信息本体的接收对象的信息,确定用于表征信息本体的接收对象分布的发散度;
关系占比确定单元,用于根据所述数据获得单元获得的信息本体的接收对象的信息和所述关系类型数据,分别确定所述行为主体的各个关系类型在所述行为主体的所有关系类型中的关系占比值;
行为参数确定单元,用于根据所述数据获得单元获得的行为数据,确定用于表征行为特征的行为参数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210484445.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双侧悬挑桁架卸载系统
- 下一篇:系统化建筑板模