[发明专利]产品推荐路径生成方法、装置、设备及存储介质有效
申请号: | 202110848732.6 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113297338B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 黄宇翔;王健宗;倪子凡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/245 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
地址: | 518057 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品 推荐 路径 生成 方法 装置 设备 存储 介质 | ||
1.一种产品推荐路径生成方法,其特征在于,所述方法包括:
获取目标产品的业务数据和与所述业务数据相关联的业务流程信息;
根据所述业务流程信息确定各个业务数据在业务流程中要到达某一业务节点需要完成的流程或者必须准备的数据,和与当前业务节点相邻的下一业务节点的信息或者与当前业务节点相邻的上一业务节点的信息;对各个业务数据在业务流程中要到达某一业务节点需要完成的流程或者必须准备的数据,以及与当前业务节点相邻的下一业务节点的信息或者与当前业务节点相邻的上一业务节点的信息进行聚合,得到所述目标产品对应业务数据的知识图谱;
其中,所述知识图谱包括预先确定的需要向目标客户推荐的产品对应业务数据、所述业务数据在业务流程中经过的各个业务节点和各个所述业务节点之间的路径关系;
通过注意力机制构造所述业务数据、各个所述业务节点和各个所述业务节点之间的路径对应的离散原子符号的三元组,基于所述三元组训练预设的聚类模型,将各个业务节点嵌入至目标产品对应的业务流程中;根据嵌入各个所述业务节点的所述业务流程的节点信息包括的业务节点在业务流程中的位置信息,得到状态向量;其中,业务节点在业务流程中的位置信息为业务流程中对应的该业务节点在知识图中的位置;
根据所述状态向量,从所述目标产品对应业务数据在业务流程中经过的各个业务节点中选择出目标业务节点;
构建目标路径的马尔科夫策略网络,基于所述目标业务节点构建所述马尔科夫策略网络中的随机策略;
利用梯度下降算法更新所述马尔科夫策略网络的参数,直至所述马尔科夫策略网络输出所述目标产品的推荐路径。
2.根据权利要求1所述的产品推荐路径生成方法,其特征在于,所述根据所述状态向量,从所述目标产品对应业务数据在业务流程中经过的各个业务节点中选择出目标业务节点,包括:
获取所述目标路径上各个路径节点信息;
根据预设的相似度函数,分别计算所述状态向量中的各个节点信息与所述目标路径上各个路径节点信息之间的相似度;
根据所述相似度从各个所述业务节点中选择出目标业务节点。
3.根据权利要求2所述的产品推荐路径生成方法,其特征在于,所述马尔科夫策略网络为监督策略网络;所述构建目标路径的马尔科夫策略网络,基于所述目标业务节点构建所述马尔科夫策略网络中的随机策略,包括:
根据所述目标路径和与所述目标路径具有关联关系的各个路径节点组成样本对;
将所述样本对作为所述监督策略网络的输入,以所述目标业务节点在所述目标路径上的概率值作为所述监督策略网络的随机策略。
4.根据权利要求3所述的产品推荐路径生成方法,其特征在于,所述利用梯度下降算法更新所述马尔科夫策略网络的参数,直至所述马尔科夫策略网络输出所述目标产品的推荐路径,包括:
将所述样本对输入所述马尔科夫策略网络中,基于蒙塔卡洛策略梯度更新所述马尔科夫策略网络的参数;
若所述监督策略网络的随机策略的期望值大于预设的期望阈值,则停止更新所述马尔科夫策略网络的函数,获取更新后的所述马尔科夫策略网络输出的路径,以该路径为所述目标产品的推荐路径。
5.根据权利要求4所述的产品推荐路径生成方法,其特征在于,所述蒙塔卡洛策略梯度表示为:
其中,是梯度计算符;是随机策略的参数,是对的期望值;是在时刻t采取的路径动作;是在时刻t路径上的节点状态信息;a是所有路径动作的集合;为预设的奖励函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110848732.6/1.html,转载请声明来源钻瓜专利网。