[发明专利]基于信息熵与模糊C均值聚类的推荐系统噪声过滤方法有效
申请号: | 201710756063.3 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107633444B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 朱俊;韩立新 | 申请(专利权)人: | 南京理工大学紫金学院 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62;G06F16/9535 |
代理公司: | 南京锐恒专利代理事务所(普通合伙) 32506 | 代理人: | 刘佳伟 |
地址: | 210046 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于信息熵与模糊C均值聚类的推荐系统噪声过滤方法,其步骤如下:第一步是收集整理目标推荐系统的用户历史评分数据;第二步、使用蒙特卡洛随机模拟,构建用户评分数据的子数据集,运行推荐算法,获取到不同子数据集的信息熵与推荐精度;第三步、对信息熵集合按照不确定性高低进行分类,对推荐精度集合按照推荐精度的高低进行分类,构建经验模型判断潜在自然噪声数据的比例;第四步、对所有的用户评分数据集进行模糊聚类分析,识别并删除噪声数据;第五步、对所有的评分数据集运行推荐算法,使用推荐精度指标评价推荐质量。本发明能够实现用户评分信息的量化度量,提出的自然噪声数据过滤技术具有一定的普适性与移植性。 | ||
搜索关键词: | 基于 信息 模糊 均值 推荐 系统 噪声 过滤 方法 | ||
【主权项】:
基于信息熵与模糊C均值聚类的推荐系统噪声过滤方法,其特征在于包含以下步骤:步骤1、收集整理目标推荐系统的用户历史评分数据;步骤2、使用蒙特卡洛随机模拟,构建用户评分数据的子数据集,运行推荐算法,获取到不同子数据集的信息熵与推荐精度;步骤3、对信息熵集合按照不确定性高低进行分类,对推荐精度集合按照推荐精度的高低进行分类,构建经验模型判断潜在自然噪声数据的比例;步骤4、对所有的用户评分数据集进行模糊聚类分析,识别并删除噪声数据;步骤5、对所有的评分数据集运行推荐算法,使用推荐精度指标评价推荐质量,对比自然噪声数据过滤前后不同数据集的推荐精度,评价所提出技术在目标数据集的适用性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学紫金学院,未经南京理工大学紫金学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710756063.3/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置