[发明专利]用于检测偏离用户的方法和装置在审
申请号: | 201410599092.X | 申请日: | 2014-10-30 |
公开(公告)号: | CN105630801A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 张超;严骏驰;丁建栋;龚旻;张亚楠;王瑜 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 张亚非;于静 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 偏离 用户 方法 装置 | ||
1.一种用于检测偏离用户的方法,包括:
获取标准用户和待检测用户针对给定主题的评论;
根据标准用户和待检测用户针对给定主题的评论分别计算标 准用户和待检测用户对于给定主题的各属性维度的评分,从而分 别将标准用户和待检测用户映射到由多个属性维度构成的多维空 间中,其中属性维度反映给定主题的方面;以及
根据待检测用户与标准用户在多维空间中分布的相似性来判 断待检测用户是否是偏离用户。
2.根据权利要求1的方法,其中,所述根据待检测用户与标 准用户在多维空间中分布的相似性来判断待检测用户是否是偏离 用户包括:
在所述多维空间中分别将标准用户和待检测用户进行聚类;
对于每一个待检测用户聚类,计算其聚类中心距每个标准用 户聚类的聚类中心的距离;以及
响应于计算一待检测用户聚类的聚类中心距每个标准用户聚 类的聚类中心的距离均大于指定阈值,判断该待检测用户聚类属 于偏离用户聚类。
3.根据权利要求2的方法,还包括:
响应于计算一待检测用户聚类的聚类中心距一标准用户聚类 的聚类中心的距离小于指定阈值,判断该待检测用户聚类属于该 标准用户聚类。
4.根据权利要求1的方法,其中,所述根据标准用户和待检 测用户针对给定主题的评论分别计算标准用户和待检测用户对于 给定主题的各属性维度的评分,从而分别将标准用户和待检测用 户映射为由反映给定主题的多个方面的多个属性维度构成的多维 空间中包括:
建立评价词数据库,并赋予数据库中的评价词以分数;
确定用户评论涉及的给定主题的属性维度;
将用户评论进行评价词切分,从而获得构成该评论的一个或 多个评价词;
对于构成该评论的一个或多个评价词分别赋予不同权重;
将属于相同属性维度的所述一个或多个评价词的分数乘以其 权重后相加,从而获得该用户评论针对给定主题的该属性维度的 评分。
5.根据权利要求4的方法,其中,所述根据标准用户和待检 测用户针对给定主题的评论分别计算标准用户和待检测用户对于 给定主题的各属性维度的评分,从而分别将标准用户和待检测用 户映射为由反映给定主题的多个方面的多个属性维度构成的多维 空间中还包括:
构成矩阵,该矩阵的每一列代表一个用户,每一行代表一个 属性维度,每个元素代表相应用户针对给定主题的相应属性维度 的评分;
针对该矩阵中的缺失元素,使用矩阵填充方法进行填充。
6.一种用于检测偏离用户的装置,包括:
获取模块,被配置为获取标准用户和待检测用户针对给定主 题的评论;
评分计算模块,被配置为根据标准用户和待检测用户针对给 定主题的评论分别计算标准用户和待检测用户对于给定主题的各 属性维度的评分,从而分别将标准用户和待检测用户映射到由多 个属性维度构成的多维空间中,其中属性维度反映给定主题的方 面;以及
判断模块,被配置为根据待检测用户与标准用户在多维空间 中分布的相似性来判断待检测用户是否是偏离用户。
7.根据权利要求6的装置,其中,所述判断模块包括:
聚类子模块,被配置为在所述多维空间中分别将标准用户和 待检测用户进行聚类;
距离计算子模块,被配置为对于每一个待检测用户聚类,计 算其聚类中心距每个标准用户聚类的聚类中心的距离;以及
判断子模块,被配置为响应于计算一待检测用户聚类的聚类 中心距每个标准用户聚类的聚类中心的距离均大于指定阈值,判 断该待检测用户聚类属于偏离用户聚类。
8.根据权利要求7的装置,其中,所述判断子模块还被配置 为:
响应于计算一待检测用户聚类的聚类中心距一标准用户聚类 的聚类中心的距离小于指定阈值,判断该待检测用户聚类属于该 标准用户聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410599092.X/1.html,转载请声明来源钻瓜专利网。