[发明专利]一种样本生成方法、装置以及设备在审
申请号: | 202210295588.2 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114781488A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 赵鑫;陈旭;胡斌斌;张志强;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司;中国人民大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 肖鹏 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 生成 方法 装置 以及 设备 | ||
本说明书实施例公开了一种样本生成方法、装置以及设备。方案包括:根据物品特征,以及用户对物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,第一偏好分高于第二偏好分;根据设定的注意力扰动参数,对第一样本用户的注意力特征进行调整,并根据调整后的注意力特征,对第一偏好分和第二偏好数据进行更新;以减小更新后的第一偏好分与第二偏好分之间的差距为目标,学习注意力扰动参数的目标取值;在目标取值下,若更新后的第一偏好分低于第二偏好分,则根据调整后的注意力特征,生成第二样本用户,用于训练模型。
技术领域
本说明书涉及机器学习技术领域,尤其涉及一种样本生成方法、装置以及设备。
背景技术
随着计算机和互联网技术的发展,人工智能的应用也越加广泛,其中比较常见的是通过训练模型,来实现相应的功能,比如,通过模型对用户的偏好和行为进行预测、图像分析识别、用户情感计算等。
通常来说,需要采集大量的训练样本,通过该样本训练生成模型。然而,在一些场合中,可能会由于客观情况,导致所采集的样本数量过少、特征平衡性不足等情况发生。
基于此,需要一种能够提高模型准确度的样本生成方案。
发明内容
本说明书一个或多个实施例提供一种样本生成方法、装置、设备以及存储介质,用以解决如下技术问题:需要一种能提高证模型准确度的样本生成方案。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供的一种样本生成方法,包括:
根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
本说明书一个或多个实施例提供的一种样本生成装置,包括:
偏好分预测模块,根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
特征调整模块,根据设定的注意力扰动参数,对所述第一样本用户的注意力特征进行调整,并根据所述调整后的注意力特征,对所述第一偏好分和所述第二偏好数据进行更新;
扰动参数学习模块,以减小所述更新后的第一偏好分与第二偏好分之间的差距为目标,学习所述注意力扰动参数的目标取值;
样本用户生成模块,在所述目标取值下,若所述更新后的第一偏好分低于第二偏好分,则根据所述调整后的注意力特征,生成第二样本用户,用于训练所述模型。
本说明书一个或多个实施例提供的一种样本生成设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据物品特征,以及用户对所述物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,所述第一偏好分高于所述第二偏好分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司;中国人民大学,未经支付宝(杭州)信息技术有限公司;中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210295588.2/2.html,转载请声明来源钻瓜专利网。