[发明专利]一种产品推荐方法、装置、电子设备及存储介质在审
| 申请号: | 202210420129.2 | 申请日: | 2022-04-20 |
| 公开(公告)号: | CN114756753A | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 刘文海;于敬;石京京;王灿;李文聪;熊凡;丁佼;陈运文;纪达麒 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06K9/62;G06N20/00;G06F16/2458 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 王风茹 |
| 地址: | 201203 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 产品 推荐 方法 装置 电子设备 存储 介质 | ||
1.一种产品推荐方法,其特征在于,包括:
获取目标用户的用户描述数据;
将用户描述数据输入至通过联邦学习训练的本地离线产品推荐网络,并获取与目标用户对应的至少一个待推荐产品;
获取目标用户的当前状态数据,并根据当前状态数据和用户描述数据,构建与每个待推荐产品分别对应的查询数据;
将各查询数据输入至基于强化学习的在线产品推荐网络,获取与各待推荐产品对应的产品推荐值,并根据各产品推荐值,向目标用户进行产品推荐。
2.根据权利要求1所述的方法,其特征在于,在将用户描述数据输入至通过联邦学习训练的本地离线产品推荐网络之前,还包括:
根据本地用户描述数据集,以及产品描述数据集,对所述本地离线产品推荐网络进行训练,得到本地训练参数;
将所述本地训练参数发送至联邦学习服务器进行联合训练;
其中,所述联邦学习服务器用于根据所述本地训练参数,以及至少一个第三方节点根据第三方用户描述数据集训练得到的第三方训练参数进行联合训练,得到联合训练参数;
根据联邦学习服务器反馈的联合训练参数,对所述本地离线产品推荐网络进行参数更新。
3.根据权利要求1或2所述的方法,其特征在于,将用户描述数据输入至通过联邦学习训练的本地离线产品推荐网络,并获取与目标用户对应的至少一个待推荐产品,包括:
将用户描述数据输入至通过联邦学习训练的本地离线产品推荐网络;
通过所述本地离线产品推荐网络,计算与所述用户描述数据匹配的用户特征向量;
通过所述本地离线产品推荐网络,计算各产品的产品特征向量与所述用户特征向量之间的相似度;
通过所述本地离线产品推荐网络,根据相似度计算结果,输出所述用户特征向量以及至少一个待推荐产品的产品特征向量。
4.根据权利要求3所述的方法,其特征在于,根据当前状态数据和用户描述数据,构建与每个待推荐产品分别对应的查询数据,包括:
计算与所述当前状态数据匹配的状态特征向量;
将每个待推荐产品的产品特征向量,分别与所述用户特征向量以及所述状态特征向量进行组合,构建出与每个待推荐产品分别对应的查询数据。
5.根据权利要求1所述的方法,其特征在于,将各查询数据输入至基于强化学习的在线产品推荐网络,获取与各待推荐产品对应的产品推荐值,包括:
将各查询数据输入至基于强化学习的在线产品推荐网络,并获取在线产品推荐网络的训练网络的奖赏函数数据;
通过所述在线产品推荐网络的训练网络,获取与所述目标用户的当前状态数据对应的目标用户的推荐动作数据;
通过所述在线产品推荐网络的训练网络,根据所述推荐动作数据,确定所述目标用户的更新状态数据,并更新所述奖赏函数数据,得到更新奖赏函数数据;
通过所述在线产品推荐网络的训练网络,根据所述推荐动作数据、所述更新状态数据和所述更新奖赏函数数据,确定目标值函数数据;
在确定所述目标值函数数据满足收敛条件的情况下,根据所述目标值函数数据更新在线产品推荐网络的更新网络;
根据更新后的在线产品推荐网络的更新网络,获取与各待推荐产品对应的产品推荐值。
6.根据权利要求5所述的方法,其特征在于,在所述获取在线产品推荐网络的训练网络的奖赏函数数据之前,还包括:
根据第三方节点中的用户历史行为数据确定在线产品推荐网络的训练网络的奖赏函数数据。
7.根据权利要求5所述的方法,其特征在于,在所述通过所述在线产品推荐网络的训练网络,根据所述推荐动作数据、所述更新状态数据和所述更新奖赏函数数据,确定目标值函数数据之后,还包括:
在确定所述目标值函数数据未满足收敛条件的情况下,返回执行通过所述在线产品推荐网络的训练网络,获取与所述目标用户的当前状态数据对应的目标用户的推荐动作数据的操作,直至目标值函数数据满足收敛条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210420129.2/1.html,转载请声明来源钻瓜专利网。





