[发明专利]用于检测偏离用户的方法和装置在审
申请号: | 201410599092.X | 申请日: | 2014-10-30 |
公开(公告)号: | CN105630801A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 张超;严骏驰;丁建栋;龚旻;张亚楠;王瑜 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 张亚非;于静 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 偏离 用户 方法 装置 | ||
技术领域
本发明涉及计算机及互联网技术领域,具体涉及一种用于检测偏离用 户的方法和装置。
背景技术
随着互联网技术的发展,门户网站、论坛、微博、微信等社交网络平 台已成为人们获取和分享信息和资源的越来越重要的途径,且已发展成为 一种虚拟的社会形态。在各种社交网络平台上,人们会针对各种主题(例 如,某种产品等)发表各种评论,这些评论对于全面了解和评估该主题的 各方面具有重要意义。然而,在网络上也存在许多偏离用户评论,这些偏 离用户评论或者是对某个主题的某个方面有着偏离主流的想法,因而不顾 及该主题的其他方面;或者属于网络“水军”,他们通常受雇于人,出于 营销或不正当竞争等特定目的,发表大量非正常评论来控制舆论。因此, 如何从网络上的大量评论中排除偏离用户的评论,获得更为理性和客观的 用户评论,以有助于获得对特定主题的更理性和客观的了解,是一个需要 解决的问题。
发明内容
在本发明的一个方面,提供了一种用于检测偏离用户的方法,包括: 获取标准用户和待检测用户针对给定主题的评论;根据标准用户和待检测 用户针对给定主题的评论分别计算标准用户和待检测用户对于给定主题的 各属性维度的评分,从而分别将标准用户和待检测用户映射到由多个属性 维度构成的多维空间中,其中属性维度反映给定主题的方面;根据待检测 用户与标准用户在多维空间中分布的相似性来判断待检测用户是否是偏离 用户。
在本发明的另一个方面,提供了一种用于检测偏离用户的装置,包括: 获取模块,被配置为获取标准用户和待检测用户针对给定主题的评论;评 分计算模块,被配置为根据标准用户和待检测用户针对给定主题的评论分 别计算标准用户和待检测用户对于给定主题的各属性维度的评分,从而分 别将标准用户和待检测用户映射到由多个属性维度构成的多维空间,其中 属性维度反映给定主题的方面;判断模块,被配置为根据待检测用户与标 准用户在多维空间中分布的相似性来判断待检测用户是否是偏离用户。
本发明的技术方案可以有效地检测和识别来自互联网的用户评论中的 偏离用户及其评论,从而有助获得关于特定主题的排除了偏离评论的更为 理性和客观的评论。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的 上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性 实施方式中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的实施例的用于检测偏离用户的方法;
图2示意性地示出了根据本发明的实施例的用于检测偏离用户的方法 的原理;
图3示出了根据本发明的实施例的用于检测偏离用户的装置;以及
图4示出了适于用来实现本发明实施方式的示例性计算机系统/服务 器12的框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显 示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开 而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使 本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的 技术人员。
现参照图1,其示出了根据本发明的实施例的用于检测偏离用户的方 法。如图所示,该方法包括如下步骤:
在步骤101,获取针对给定主题的标准用户评论以及待检测的用户评 论。所述给定主题例如可以是某一类产品,例如汽车等,也可以是人们感 兴趣的任何其他话题。所述标准用户评论和待检测的用户评论均可以来自 于互联网,例如门户网站、网上论坛、微博、微信等。
所述标准用户评论例如可以是已被证明排除了网络水军评论等非正常 评论的正常的用户评论。所述标准用户评论可以来自于针对该给定主题的 用户评论的历史数据,例如来自采用实名制的网站的用户评论数据、得到 广泛认可的专家论坛中的评论数据、或者论坛中级别较高和获得广泛好评 的用户的评论数据等。
所述标准用户评论以及待检测的用户评论都是与用户相关联的,都具 有用户ID。该用户ID例如可以是用户在网站上注册的用户ID,或者是用 户的上网设备的IP地址等。一个用户ID可以对应于一条或多条评论。因 此,所述标准用户评论以及所述待检测的用户评论都可以被划分到不同用 户ID。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410599092.X/2.html,转载请声明来源钻瓜专利网。