[发明专利]商品推荐方法及装置在审
申请号: | 201910962727.0 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110659947A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 赵国海 | 申请(专利权)人: | 沈阳民航东北凯亚有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 李伟 |
地址: | 110024 辽宁省沈阳市*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品推荐 目标对象 电子商务领域 获取目标 用户推荐 概率 预设 感知 购物 应用 | ||
1.一种商品推荐方法,其特征在于,包括:
获取目标对象当前的状态信息;
将所述状态信息输入至预先训练的推荐模型中,得到与所述状态信息对应的动作值;
依据所述动作值确定各个待推荐商品分别对应的概率标识;
依据各个所述概率标识,选取预设数目的待推荐商品推荐至所述目标对象。
2.根据权利要求1所述的方法,其特征在于,所述获取目标对象当前的状态信息,包括:
获取当前时刻信息,并在预先建立的各个消息队列中,获取所述目标对象的对象数据;
对所述当前时刻信息及所述对象数据进行分析,得到所述目标对象当前所处的环境信息和所述目标对象的行程信息;
依据所述环境信息和所述行程信息,得到所述目标对象当前的状态信息。
3.根据权利要求1所述的方法,其特征在于,所述将所述状态信息输入至预先训练的推荐模型中,得到与所述状态信息对应的动作值,包括:
将所述状态信息输入至预先训练的推荐模型时,获取预先设置的动作空间,所述动作空间包含各个预设的动作值;
确定各个所述动作值对应的网络参数;
依据各个所述网络参数对所述状态信息进行计算,得到各个所述动作值对应的评分值;
将数值最大的评分值对应的动作值,确定为所述状态信息对应的动作值。
4.根据权利要求1所述的方法,其特征在于,所述依据各个所述概率标识,选取预设数目的待推荐商品推荐至所述目标对象,包括:
确定每个所述概率标识表征的推荐概率值的大小;
依据各个所述推荐概率值的大小,对各个待推荐商品进行排序,并按各个所述概率标识表征的推荐概率值由大至小的顺序选取预设数目的待推荐商品;
将已选取的各个待推荐商品组成推荐信息;
将所述推荐信息推荐至所述目标对象。
5.根据权利要求1所述的方法,其特在于,还包括:
获取所述目标对象的操作信息;
基于所述操作信息生成所述状态信息对应的奖励值;
依据所述状态信息、所述奖励值以及所述动作值,更新所述推荐模型的网络参数。
6.一种商品推荐装置,其特征在于,包括:
第一获取单元,用于获取目标对象当前的状态信息;
输入单元,用于将所述状态信息输入至预先训练的推荐模型中,得到与所述状态信息对应的动作值;
确定单元,用于依据所述动作值确定各个待推荐商品分别对应的概率标识;
推荐单元,用于依据各个所述概率标识,选取预设数目的待推荐商品推荐至所述目标对象。
7.根据权利要求6所述的装置,其特征在于,所述第一获取单元,包括:
获取子单元,用于获取当前时刻信息,并在预先建立的各个消息队列中,获取所述目标对象的对象数据;
分析子单元,用于对所述当前时刻信息及所述对象数据进行分析,得到所述目标对象当前所处的环境信息和所述目标对象的行程信息;
生成子单元,用于依据所述环境信息和所述行程信息,得到所述目标对象当前的状态信息。
8.根据权利要求6所述的装置,其特征在于,所述输入单元,包括:
输入子单元,用于将所述状态信息输入至预先训练的推荐模型时,获取预先设置的动作空间,所述动作空间包含各个预设的动作值;
第一确定子单元,用于确定各个所述动作值对应的网络参数;
运算子单元,用于依据各个所述网络参数对所述状态信息进行计算,得到各个所述动作值对应的评分值;
第二确定子单元,用于将数值最大的评分值对应的动作值,确定为所述状态信息对应的动作值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳民航东北凯亚有限公司,未经沈阳民航东北凯亚有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910962727.0/1.html,转载请声明来源钻瓜专利网。