[发明专利]一种带负反馈的基于深度强化学习的推荐方法及系统有效

申请号：	202010328640.0	申请日：	2020-04-23
公开（公告）号：	CN111523940B	公开（公告）日：	2023-04-18
发明（设计）人：	李玉华;李鑫;李瑞轩;辜希武	申请（专利权）人：	华中科技大学
主分类号：	G06Q30/0601	分类号：	G06Q30/0601;G06N7/01;G06N3/0442;G06N3/045;G06N3/048;G06N3/084;G06N3/092
代理公司：	华中科技大学专利中心 42201	代理人：	李智
地址：	430074 湖北***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种带负反馈的基于深度强化学习的推荐方法及系统，收集商品特征信息，同时收集用户行为数据得到用户的正负反馈行为向量；对用户的正负反馈行为向量通过特征提取网络模型得到用户的正负反馈特征混合状态向量；利用用户的正负反馈特征混合状态向量对由策略网络和估值网络组成的深度确定性策略梯度模型进行训练，直至模型收敛；根据需要进行推荐工作的用户的历史行为，先生成正负反馈特征混合状态向量，通过完成训练的深度确定性策略梯度模型生成用户推荐商品列表供给用户进行选择，完成用户推荐工作。本申请可以使得相关神经网络的参数更新得到延迟，从而减小网络之间的相关性，提升推荐方法的训练速度和准确度。
搜索关键词：	一种负反馈基于深度强化学习推荐方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华中科技大学，未经华中科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202010328640.0/，转载请声明来源钻瓜专利网。

上一篇：一种用溶胶-凝胶法制备MgSnO3
下一篇：用于伺服系统自调谐的方法及装置、伺服系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30-00 商业，例如购物或电子商务
G06Q30-02 .行销，例如，市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励；价格评估或确定
G06Q30-04 .签单或开发票
G06Q30-06 .购买、出售或租赁交易
G06Q30-08 ..拍卖

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种带负反馈的基于深度强化学习的推荐方法及系统有效

专利文献下载