[发明专利]一种样本生成方法、装置以及设备在审
申请号: | 202210295588.2 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114781488A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 赵鑫;陈旭;胡斌斌;张志强;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司;中国人民大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 肖鹏 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 生成 方法 装置 以及 设备 | ||
1.一种样本生成方法,包括:
根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
2.如权利要求1所述的方法,所述注意力扰动参数与所述第一样本用户的注意力特征为维度相同的向量;
所述根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,具体包括:
通过将设定的注意力扰动参数与所述第一样本用户的注意力特征相加,对所述注意力特征中的各维分别叠加对应的变化量,以完成对所述第一样本用户的注意力特征的调整。
3.如权利要求1所述的方法,所述以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值,具体包括:
以有条件地最小化所述更新后的第一偏好分与第二偏好分之间的差距,以及所述注意力扰动参数的扰动程度为目标,学习所述注意力扰动参数的目标取值。
4.如权利要求2所述的方法,所述学习所述注意力扰动参数的目标取值,具体包括:
根据设定的屏蔽向量,将所述注意力扰动参数中的部分维度屏蔽,得到局部扰动参数;
以有条件地最小化所述局部扰动参数的扰动程度为目标,学习所述屏蔽向量和所述局部扰动参数的目标取值。
5.如权利要求3所述的方法,所述以有条件地最小化所述更新后的第一偏好分与第二偏好分之间的差距,以及所述注意力扰动参数的扰动程度为目标,学习所述注意力扰动参数的目标取值,具体包括:
确定反映所述注意力扰动参数的扰动程度的L2范数项;
确定反映所述更新后的第一偏好分与第二偏好分之间的差距的对数项;
确定包含所述L2范数项和所述对数项的目标函数,并以最小化所述目标函数的取值为目标,学习所述注意力扰动参数的目标取值。
6.如权利要求5所述的方法,所述确定包含所述L2范数项和所述对数项的目标函数,具体包括:
确定反映所述注意力扰动参数的扰动程度的L1范数项,用于学习稀疏结构的所述注意力扰动参数;
确定包含所述L1范数项、所述L2范数项和所述对数项的目标函数。
7.如权利要求1所述的方法,所述第一物品和所述第二物品属于同一个商品推荐系统;
所述方法还包括:
利用所述第一样本用户和所述第二样本用户,训练所述模型;
通过所述训练后的模型,预测第三用户分别所述第一物品和所述第二物品的偏好分,并根据所述预测的结果,为所述第三用户推荐商品。
8.如权利要求7所述的方法,所述根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分之前,所述方法还包括:
采集第一样本用户在所述商品推荐系统中发表的评论信息;
通过所述评论信息,确定所述第一样本用户对各物品特征的注意力特征;
所述根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型,具体包括:
根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型以及用于学习所述注意力特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司;中国人民大学,未经支付宝(杭州)信息技术有限公司;中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210295588.2/1.html,转载请声明来源钻瓜专利网。