[发明专利]一种权重训练方法、装置、计算机设备和存储介质有效
| 申请号: | 202010366420.7 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111582448B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 徐宣宏 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
| 主分类号: | G06N3/096 | 分类号: | G06N3/096;G06N3/084;G06N20/00;H04L67/55 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 510000 广东省广州市番*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 权重 训练 方法 装置 计算机 设备 存储 介质 | ||
本发明实施例公开了一种权重训练方法、装置、计算机设备和存储介质,该方法包括:获取业务模型;对目标行为配置权重;计算目标行为在权重下推送业务数据给用户所呈现的评价指标,作为离线评价指标;识别离线评价指标的状态;若状态为离线评价指标未收敛,则根据评价指标调整所述权重,返回执行计算目标行为在权重下推送业务数据给用户所呈现的评价指标,作为离线评价指标;若状态为离线评价指标已收敛,则确定业务模型的权重训练完成。本实施例在离线的状态下,通过评价指标指导寻参(即设置权重),明确寻参的方向,提高权重在离线训练时的精确度,可以减少根据线上的情况对权重调整的频次,节约了大量的时间和人力,从而提高了效率。
技术领域
本发明实施例涉及机器学习的技术,尤其涉及一种权重训练方法、装置、计算机设备和存储介质。
背景技术
在信息检索、信息推荐等业务场景中,通常预先训练模型召回业务数据,从所有业务数据中选择合适的业务数据发送给用户,用户对这些业务数据进行操作,如点击、点赞、评论、分享、关注等。
在这个过程中,在先多是以CTR(Click Through Rate,点击通过率)为目标进行优化,例如,对于多媒体的业务场景,优化的目标为用户点击发送的短视频,这种方式导致返回给用户的信息多注重业务数据的标题、封面等直接显示给用户的信息,使得用户更容易点击该业务数据,但是,该业务数据的内容可能较差,使得用户点击并浏览该业务数据之后迅速关闭,用户体验较差。
对此,现在多是以多个不同的目标进行优化,即使用模型对业务数据计算多个不同目标的概率,配合相应的权重选择合适的信息,综合考虑用户各个方面的需求,以期提高用户体验。
针对该权重,目前是以历史经验初始化,然后上线模型、权重之后,根据在线的情况调整权重。
但是,在同一业务场景下,目标之间的相关性比较强,例如,用户对感兴趣的短视频会同时点赞、评论、分享、关注,使得调整某一个目标的权重都会在一定程度上给其他目标带来波动,对权重的调整造成干扰,使得需要反复多次调整,才最终确定权重的值,即这种方式要反复先观察线上的情况再来调整权重,需要大量的用户流量进行试验,耗费大量的时间和人力,效率较低。
发明内容
本发明实施例提供一种权重训练方法、装置、计算机设备和存储介质,以解决以多目标优化模型的权重时,训练权重的效率较低的问题。
第一方面,本发明实施例提供了一种权重训练方法,包括:
获取业务模型,所述业务模型用于计算用户对业务数据执行多个目标行为的概率;
对所述目标行为配置权重;
计算所述目标行为在所述权重下推送业务数据给用户所呈现的评价指标,作为离线评价指标;
识别所述离线评价指标的状态;
若所述状态为所述离线评价指标未收敛,则根据所述评价指标调整所述权重,返回执行所述计算所述目标行为在所述权重下推送业务数据给用户所呈现的评价指标,作为离线评价指标;
若所述状态为所述离线评价指标已收敛,则确定所述业务模型的权重训练完成。
可选地,所述对所述目标行为配置权重,包括:
确定参考模型,所述参考模型用于计算用户对业务数据执行多个候选行为的概率,所述候选行为对应的权重已完成训练,所述目标行为与所述候选行为部分相同;
若所述目标行为与任一所述候选行为相同,则将所述候选行为对应的权重赋值给所述目标行为的权重;
若所述目标行为与所有所述候选行为不同,则随机对所述目标行为设置权重;
和/或,
随机对所述目标行为设置权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010366420.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像降噪方法及装置、电子设备和存储介质
- 下一篇:电池包





