[发明专利]基于状态转移的奖励值音乐推荐方法有效

申请号：	201810050005.3	申请日：	2018-01-18
公开（公告）号：	CN108280165B	公开（公告）日：	2020-05-05
发明（设计）人：	琚生根;孙界平;谭斌;夏欣;刘勇;王霞;刘若晨	申请（专利权）人：	四川大学
主分类号：	G06F16/68	分类号：	G06F16/68;G06F16/635
代理公司：	成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304	代理人：	何健雄
地址：	610041 四川***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于状态转移奖励音乐推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于状态转移的奖励值音乐推荐方法，其特征在于，包括以下步骤：

(1)初始化用户偏好及音乐特征向量权重；

(2)分别计算用户u个性化的song_i-1到song_i的转移概率矩阵P_u(song_i|song_i-1)和用户总体的song_i-1到song_i的转移概率矩阵P_z(song_i|song_i-1)；

(3)定义奖励函数为R＝R_s(song_i)+R_t(s_i-1,song_i)，根据R(song_i)排序，按照从大到小的顺序，将音乐集M筛减成M*并聚类；

(4)生成候选推荐列表L，其长度为X；具体包括以下步骤：

按照历史列表中训练数据的最后一首音乐所属类，检索P_u(song_i|song_i-1)和P_z(song_i|song_i-1)，在转移概率非0的簇内选择奖励值最大的音乐，作为候选推荐列表L的第一首音乐；如果用户u的历史播放列表HL长度m20，检索P_u(song_i|song_i-1)在转移概率非0的簇内选择奖励值最大的音乐，作为候选推荐列表L的第i首音乐；如果用户u的历史播放列表HL长度m≤20，检索P_z(song_i|song_i-1)在转移概率非0的簇内选择奖励值最大的音乐，作为候选推荐列表L的第i首音乐；以此类推，得到长度为X的候选推荐列表L；

(5)针对候选推荐列表L对用户偏好在线更新，得到φ_s(u)；具体包括以下步骤：

遍历候选推荐列表L：

r_i＝R_s(song_i)

其中，r_i为在当前状态下用户听完song_i产生的立即奖励，即R_s(song_i)＝φ_s(u)·β·θ_s(song_i)+α·c_u·TP(song_i)中计算得到的R_s(song_i)，为目前为止的平均奖励，定义该变量可以决定下一首音乐的选择对当前更新是否有增益，最后，模型为更新φ_s(u)分配的权值之和为1；

(6)计算候选推荐列表L中每首音乐到各个聚类中心c_j的欧式距离ο(song,c_i)；

(7)构建基于状态转移的奖励值函数：式中，φ_s(u)是用户u的个性化偏好，由用户的历史数据迭代分析而来，θ_s(song_i)是音乐song_i的特征向量，β是θ_s(song_i)每一维的权重，用来度量θ_s(song_i)每一维特征属性对奖励值的贡献度，c_u是用户u的从众度，由用户个性化自定义，TP(song_i)表示音乐song_i的流行度，α是TP(song_i)的放大因子，是个可调参数；ο(song_i,c_j)是song_i与c_j的欧氏距离，c_j指j簇的聚类中心，P_u(song_i|song_i-1)和P_z(song_i|song_i-1)分别指用户u个性化的song_i-1到song_i的转移概率和用户总体的song_i-1到song_i的转移概率；

(8)选择奖励值最大的状态序列，即为奖励值最大的推荐音乐列表L*。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川大学，未经四川大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810050005.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于类别相关单词的短文本过滤与分类方法
下一篇：表情的制作方法、装置、终端及计算机可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于状态转移的奖励值音乐推荐方法有效

专利文献下载