[发明专利]基于状态转移的奖励值音乐推荐方法有效
申请号: | 201810050005.3 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108280165B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 琚生根;孙界平;谭斌;夏欣;刘勇;王霞;刘若晨 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/68 | 分类号: | G06F16/68;G06F16/635 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 610041 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 状态 转移 奖励 音乐 推荐 方法 | ||
1.一种基于状态转移的奖励值音乐推荐方法,其特征在于,包括以下步骤:
(1)初始化用户偏好及音乐特征向量权重;
(2)分别计算用户u个性化的songi-1到songi的转移概率矩阵Pu(songi|songi-1)和用户总体的songi-1到songi的转移概率矩阵Pz(songi|songi-1);
(3)定义奖励函数为R=Rs(songi)+Rt(si-1,songi),根据R(songi)排序,按照从大到小的顺序,将音乐集M筛减成M*并聚类;
(4)生成候选推荐列表L,其长度为X;具体包括以下步骤:
按照历史列表中训练数据的最后一首音乐所属类,检索Pu(songi|songi-1)和Pz(songi|songi-1),在转移概率非0的簇内选择奖励值最大的音乐,作为候选推荐列表L的第一首音乐;如果用户u的历史播放列表HL长度m20,检索Pu(songi|songi-1)在转移概率非0的簇内选择奖励值最大的音乐,作为候选推荐列表L的第i首音乐;如果用户u的历史播放列表HL长度m≤20,检索Pz(songi|songi-1)在转移概率非0的簇内选择奖励值最大的音乐,作为候选推荐列表L的第i首音乐;以此类推,得到长度为X的候选推荐列表L;
(5)针对候选推荐列表L对用户偏好在线更新,得到φs(u);具体包括以下步骤:
遍历候选推荐列表L:
ri=Rs(songi)
其中,ri为在当前状态下用户听完songi产生的立即奖励,即Rs(songi)=φs(u)·β·θs(songi)+α·cu·TP(songi)中计算得到的Rs(songi),为目前为止的平均奖励,定义该变量可以决定下一首音乐的选择对当前更新是否有增益,最后,模型为更新φs(u)分配的权值之和为1;
(6)计算候选推荐列表L中每首音乐到各个聚类中心cj的欧式距离ο(song,ci);
(7)构建基于状态转移的奖励值函数:式中,φs(u)是用户u的个性化偏好,由用户的历史数据迭代分析而来,θs(songi)是音乐songi的特征向量,β是θs(songi)每一维的权重,用来度量θs(songi)每一维特征属性对奖励值的贡献度,cu是用户u的从众度,由用户个性化自定义,TP(songi)表示音乐songi的流行度,α是TP(songi)的放大因子,是个可调参数;ο(songi,cj)是songi与cj的欧氏距离,cj指j簇的聚类中心,Pu(songi|songi-1)和Pz(songi|songi-1)分别指用户u个性化的songi-1到songi的转移概率和用户总体的songi-1到songi的转移概率;
(8)选择奖励值最大的状态序列,即为奖励值最大的推荐音乐列表L*。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810050005.3/1.html,转载请声明来源钻瓜专利网。