[发明专利]增益模型的训练方法及装置在审
申请号: | 202111447295.3 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114139724A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 陈炫颖;刘致宁;俞力;姚柳佚;顾立宏 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08;G06F16/9535;G06Q30/02 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈婧玥;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 增益 模型 训练 方法 装置 | ||
1.一种增益模型的训练方法,包括:
将用户集中任意目标用户的用户特征,分别输入基于有干预用户而训练的第一预测模型、基于无干预用户而训练的第二预测模型和干预倾向预测模型,对应得到该目标用户针对目标行为的第一预测结果,第二预测结果,和该用户是否被干预的干预倾向分数;
根据所述第一预测结果、第二预测结果、干预倾向分数,以及该目标用户的行为标签,确定该目标用户响应干预的增益标签,所述增益标签与所述干预倾向分数成线性关系;
基于所述用户集中各个用户的用户特征和增益标签,训练所述增益模型。
2.根据权利要求1所述的方法,其中,所述干预为发放与所述目标行为相关的权益,或者,为推送与所述目标行为相关的内容信息。
3.根据权利要求1所述的方法,其中,所述第一预测模型的训练包括:基于所述用户集中多个有干预用户的用户特征和行为标签,训练所述第一行为预测模型。
4.根据权利要求1所述的方法,其中,所述第二预测模型的训练包括:基于所述用户集中多个无干预用户的用户特征和行为标签,训练所述第二行为预测模型。
5.根据权利要求1所述的方法,其中,所述干预倾向预测模型的训练包括:基于所述用户集中各个用户的用户特征以及有无干预,训练所述干预倾向预测模型。
6.根据权利要求1所述的方法,其中,根据第一预测结果、第二预测结果、干预倾向分数,以及该目标用户的行为标签,确定该目标用户响应干预的增益标签,包括:
根据所述行为标签和与所述目标用户的实际干预情况相反情况下的预测结果,确定基础值;
根据所述行为标签和所述实际干预情况所对应的预测结果,确定修正值,并基于所述干预倾向分数对所述修正值进行加权处理;
根据所述基础值以及所述加权处理的结果,确定所述增益标签。
7.根据权利要求6所述的方法,其中,基于所述干预倾向分数对所述修正值进行加权处理包括:
根据所述干预倾向分数确定权重因子,其中,当所述实际干预情况为有干预时,所述权重因子随所述干预倾向分数线性单调递减;当所述实际干预情况为无干预时,所述权重因子随所述干预倾向分数线性单调递增;
将所述修正值与所述权重因子的乘积,作为所述加权处理的结果。
8.根据权利要求6所述的方法,其中,所述确定基础值包括:
当所述实际干预情况为有干预时,利用所述行为标签减去所述第二预测结果,得到所述基础值;或,
当所述实际干预情况为无干预时,利用所述第一预测结果减去所述行为标签,得到所述基础值。
9.根据权利要求6所述的方法,其中,所述确定修正值包括:
当所述实际干预情况为有干预时,利用所述行为标签减去所述第一预测结果,得到所述修正值;或,
当所述实际干预情况为无干预时,利用所述第二预测结果减去所述行为标签,得到所述修正值。
10.根据权利要求6-9中任一项所述的方法,其中,确定所述增益标签,包括:
确定所述基础值与所述加权处理的结果之间的和值,作为所述增益标签。
11.根据权利要求1所述的方法,其中,所述用户集中所述有干预用户的数量小于所述无干预用户的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111447295.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车防撞梁
- 下一篇:基于OJ平台的多用户题库共建方法、系统及题库