[发明专利]一种基于多臂赌博机置信上限的推荐系统冷启动方法在审

专利信息
申请号: 201710796663.2 申请日: 2017-09-06
公开(公告)号: CN107563867A 公开(公告)日: 2018-01-09
发明(设计)人: 王宝亮;王宇琛 申请(专利权)人: 天津大学
主分类号: G06Q30/06 分类号: G06Q30/06;G06K9/62
代理公司: 天津市北洋有限责任专利代理事务所12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 赌博机 置信 上限 推荐 系统 冷启动 方法
【说明书】:

技术领域

发明涉及个性化推荐技术,具体涉及一种基于多臂赌博机置信上限的推荐系统冷启动方法。

技术背景

随着信息科技的快速发展,互联网每一天都以爆炸式的速度产生海量的数据,人们生产、复制、传播信息的能力大大增强,每一个用户都成为互联网信息的生产者。用户在选择自己需要的信息时花费越来越多的时间,甚至根本无法自主筛选,导致信息使用效率降低,信息量大反而成为了一种负担,出现了信息过载问题。为了更好的解决信息过载问题,个性化推荐系统应运而生,该系统能够根据用户历史行为信息准确预判用户需求,进而进行推荐。这是建立在海量数据挖掘基础上的一种高级商务智能系统,为用户提供了完全个性化的决策支持和信息服务,使人们更加受益于互联网、大数据。

个性化推荐系统是根据用户的历史行为和购买记录等信息,构建针对具体用户的个性化用户特征,将商品进行筛选,推荐给与用户特征相近的商品。目前,个性化推荐系统已经在互联网的各个领域得到了广泛的应用。如亚马逊,淘宝等电子商务领域,今日头条等新闻领域,网易云音乐等音乐领域,Netflix、豆瓣等电影领域都在使用推荐算法。目前个性化推荐系统方法主要有基于规则的推荐、协同过滤推荐、基于内容的推荐、基于社交的推荐和混合推荐系统等。

个性化推荐系统的整体流程主要包括:收集并整理用户的历史记录和行为反馈构建数据集;根据数据集运用相应的算法得到用户特征;根据用户特征选取相对应的商品,并将商品推荐给用户;记录用户对推荐商品的反馈,评价推荐效果并更新数据集。

发明内容

本发明的目的就是将多臂赌博机模型中的置信区间上限算法运用到推荐系统的冷启动中,将推荐过程视为多臂赌博机模型,并基于置信区间上限算法为特征未知的用户进行推荐,根据用户的点击行为,不断拟合出趋近于用户真实的特征,从而为用户进行越来越准确的推荐,解决冷启动问题。

一种基于多臂赌博机置信上限的推荐系统冷启动方法,包括下列步骤:

(1)进行数据收集构建商品数据集并预处理,获得格式规范的商品显性特征:从网络平台选取一定数量的商品,构成商品数据集,其中包括商品ID,用户和商家对该商品所打标签、评价信息,对商品文本信息进行预处理,输出格式规范的商品显性特征;

(2)根据商品显性特征,基于潜在狄利克雷算法构造商品隐形特征,设置输出的商品隐形特征维度,重新标记商品ID;

(3)初始化用户特征及相关参数:在冷启动问题中,用户特征未知,需要对用户特征以及相应的权重参数赋予初始值;

(4)基于商品数据集构建候选商品集:根据商品隐形特征对商品数据集进行K-means聚类,将商品聚类,在同一类簇中的商品具有相似的性质,在不同类簇中的商品差异性较大,从每个类簇中分别随机抽取一个商品,构建候选商品集;

(5)将从候选商品集中挑选最优商品视为多臂赌博机问题,基于置信区间上界算法计算出估分最高的商品,作为推荐商品;

(6)将候选商品集中评分最高的商品推荐给用户后,用户将根据自身喜好,选择是否点击该商品,从而系统获得用户对推荐结果的反馈,根据反馈更新用户特征以及权重参数;

(7)重复上述(3)到(6)步骤,对用户进行多轮推荐,根据多轮反馈结果,不断更新用户特征,从而达到越来越高的用户特征拟合度,从而获得较为准确的推荐,缓解冷启动问题。

具体实施方式

本发明在推荐过程的冷启动问题中,引入了多臂赌博机模型和置信区间的思想。该思想的主要内容是:利用特征已知的商品数据集,为特征未知的用户进行推荐,根据用户的点击行为,不断拟合出趋近于用户真实的特征,从而为用户进行越来越准确的推荐,解决冷启动问题。具体步骤如下:

1数据集预处理

首先从网络平台选取一定数量的商品,默认所选商品不是新上架商品,因此可以根据商家提供的信息,以及用户对商品的评价、分类来获取商品的显性特征。然后对商品显性特征进行预处理,因为显性特征中用户对商品所打标签用词存在不规范现象,如将两词连写在一起,同义词,无意义的乱码等,因此要进行切词、取词干、停用等处理,最终将显性特征整理成规范的关键词的形式,便于后续处理。

2计算商品潜在特征,构建商品数据集

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710796663.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top