[发明专利]一种推荐模型的训练方法、介质、电子设备和推荐模型有效
| 申请号: | 202011109159.9 | 申请日: | 2020-10-16 |
| 公开(公告)号: | CN112184391B | 公开(公告)日: | 2023-10-10 |
| 发明(设计)人: | 许倩倩;郝前秀;杨智勇;黄庆明 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 推荐 模型 训练 方法 介质 电子设备 | ||
本发明实施例提供了一种推荐模型的训练方法、介质、电子设备和推荐模型,训练方法包括A1、构建推荐模型、损失构建模块和多目标优化模块;A2、获取不同用户的商品交互记录,根据用户属性设置不同的用户组;A3、利用商品交互记录对推荐模型进行多次迭代训练至收敛,其中,每次训练包括:A31、用推荐模型从本次获取的商品交互记录中学习用户对商品的决策过程,获取用户对所有商品的偏好概率;A32、基于用户对所有商品的偏好概率,损失构建模块构建第一损失函数用于计算针对不同用户的推荐准确性损失以及构建连续可微的第二损失函数用于计算针对不同的用户组的推荐公平性损失;A33、多目标优化模块根据推荐准确性损失和推荐公平性损失确定参数更新方向。
技术领域
本发明涉及数据处理技术领域,具体来说涉及推荐技术领域,更具体地说,涉及一种推荐模型的训练方法、介质、电子设备和推荐模型。
背景技术
推荐系统是互联网发展的重要增长引擎,已被广泛应用于诸如电商推荐、电影推荐、新闻推荐、音乐推荐等众多场景。推荐系统为用户从海量的物品中推荐其可能感兴趣的物品,帮助用户在信息过载的情况下高效地做出决策。
随着推荐系统的广泛应用,推荐系统的公平性逐渐引起关注。由于种种原因,现实中的用户与物品的历史交互数据不可避免地存在不均衡和偏置现象。例如,新用户和中老年人用户因过去在推荐系统中不活跃,商品交互记录数据稀疏;小众爱好者偏好的小众商品在大部分用户的交互记录中都未曾出现过等等。这种情况下,仅依靠一个总体目标损失的数据驱动训练策略,很有可能导致模型牺牲少数群体的推荐准确率以保证总体推荐准确率,从而产生不公平的推荐结果。然而,提升少数群体的用户体验满意度,尤其新用户以及中老年用户的推荐体验,对平台的扩展、用户留存等十分重要。
构建公平的推荐系统有两大关键问题:一是构建合适的准确性损失函数以及公平性损失函数,二是如何形式化地权衡推荐准确性与公平性。
对于关键问题一:从不同的公平性损失定义角度出发,现有的考虑公平性的推荐算法主要可以分为三类方法:第一类方法针对打包推荐(Package-to-Grouprecommendation,即为同一组用户推荐相同的商品)的应用场景,比如一些现有方法中通过定义商品对用户的效用函数,训练公平的推荐策略,使所推荐商品对同一组内不同用户具有公平的效用;第二类方法旨在追求不同平台参与方(用户和商家)之间效用的公平性;第三类方法旨在实现不同的商品之间相对公平的排序。尽管现在有许多方法定义了不同的公平性度量,但目前为止,尚没有工作从不同用户组的推荐准确率方面考虑公平性。其主要限制因素是:推荐算法一般将用户物品预测得分的前K个物品预测为正样本,此排序操作不可导,故基于排序的准确性度量(如精准率、召回率)均不可导,从而无法高效地训练和优化推荐模型。
对于关键问题二,现有方法实现公平推荐主要通过以下两个途径:第一个途径是将推荐问题形式化为一个受限优化问题,求解在一定公平限制条件下,最大化推荐的准确率。其中,一些现有技术采用后处理方法,以单一准确率为目标训练好模型后,提出一些后续处理技术,增加推荐策略的公平性;还有一些现有技术采用传统的受限优化算法求解该问题,或者利用强化学习求解该受限优化问题。第二个途径是将推荐准确性损失与公平性损失进行加权求得到一个总的代理损失,通过最小化代理损失求解模型;但这种方法需要对权重进行网格搜索,耗时耗力。更重要的是,加权求和的形式仅适用于不同目标损失具有一致性的情况。然而,由于不同用户组的历史记录存在不均衡和偏置,公平性目标与总体准确性目标之间存在竞争关系。因此,优化加权求和的代理损失将产生何种性质的解并不为人知。
因此,现有的推荐系统难以在推荐的准确性与公平性之间获得较好的权衡,导致一些少数群体的用户体验不佳。因此,有必要对现有技术进行改进。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,尤其是解决在不同用户组的商品交互记录具有偏差时,推荐系统中总体推荐准确性和不同用户组的推荐公平性之间的权衡问题,提供一种推荐模型的训练方法、介质、电子设备和推荐模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011109159.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳纤维引擎盖加工用淬火装置
- 下一篇:一种系鞋带设备





