[发明专利]模型训练方法和装置、服务装置和存储介质在审
| 申请号: | 202210504149.8 | 申请日: | 2022-05-10 |
| 公开(公告)号: | CN114819145A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 白俊杨 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N20/00 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹蓓;方亮 |
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 服务 存储 介质 | ||
本公开提出一种模型训练方法和装置、服务装置和存储介质,涉及机器学习技术领域。本公开的一种模型训练方法包括:针对每条用户行为样本数据,通过教师模型处理用户行为样本数据,获得第一打分值,并根据第一打分值和用户行为样本数据的标签确定第一损失值,其中,第一损失值在教师模型中反向传播;通过学生模型处理用户行为样本数据,获得第二打分值,并根据第二打分值和用户行为样本数据的标签确定第二损失值,其中,第二损失值在学生模型中反向传播;根据第一打分值和第二打分值获取第三损失值,第二损失值和第三损失值在学生模型中反向传播。通过这样的方法,能够缩短训练时间,提高了迭代速度和训练效率。
技术领域
本公开涉及机器学习技术领域,特别是一种模型训练方法和装置、服务装置和存储介质。
背景技术
随着互联网行业的深入发展,用户行为数据呈现指数级的增长,进而与排序相关的模型变得越来越复杂。尤其是id类特征的融入,这些模型的参数量可达上千万甚至上亿的数量级。模型参数量的迅速增大,致使模型在线服务时,性能问题日益凸显,从而严重制约了排序模型的正常迭代。排序模型受在线性能的制约越来越严重。
目前在基于Tensorflow的框架下,采用TFLite,即Tensorflow的轻量级模型,通过对模型进行量化和裁剪来达到快速提升模型性能的目的,能快速达到提升模型性能。通过特征选择的方式对特征进行筛选,也是解决该问题的一种方法。同时,模型蒸馏的思路也是业界解决该问题的一种方向。
发明内容
本公开的一个目的在于提高模型训练的效率。
根据本公开的一些实施例的一个方面,提出一种模型训练方法,包括:针对每条用户行为样本数据,通过教师模型处理用户行为样本数据,获得第一打分值,并根据第一打分值和用户行为样本数据的标签确定第一损失值,其中,第一损失值在教师模型中反向传播;通过学生模型处理用户行为样本数据,获得第二打分值,并根据第二打分值和用户行为样本数据的标签确定第二损失值,其中,第二损失值在学生模型中反向传播;根据第一打分值和第二打分值获取第三损失值,第三损失值仅在学生模型中反向传播。
在一些实施例中,该方法还包括:在前序训练过程中,针对每条用户行为样本数据,通过待前序训练的教师模型处理用户行为样本数据,获取教师模型损失值,将教师模型损失值在待前序训练的教师模型中反向传播;完成前序训练,获取教师模型。
在一些实施例中,教师模型中包括网络结构或初始化方式中至少一项不同的多个模型。
在一些实施例中,通过教师模型处理用户行为样本数据,获得第一打分值,并根据第一打分值和用户行为样本数据的标签确定第一损失值包括:获取教师模型中的每个模型分别处理用户行为样本数据获得的单模型打分值;结合教师模型中的每个模型的单模型打分值,获取第一打分值;根据第一打分值和对应的用户行为样本数据,获取第一损失值。
在一些实施例中,结合每个模型的单模型打分值,获取第一打分值包括:根据每个模型的预设权重和单模型打分值,获取单模型打分值的加权和,作为第一打分值。
在一些实施例中,通过待前序训练的教师模型处理用户行为样本数据,获取教师模型损失值包括:通过每个待前序训练的教师模型分别处理用户行为样本数据,获取每个模型确定的单模型损失值,其中,教师模型中包括网络结构或初始化方式中至少一项不同的多个模型;结合每个模型的确定的单模型损失值,获取教师模型损失值;将教师模型损失值在待前序训练的教师模型中反向传播包括:将教师模型损失值在待前序训练的教师模型的每个模型中反向传播。
在一些实施例中,该方法还包括:根据第一损失值、第二损失值和第三损失值获取模型训练损失值,其中,第三损失值的权重小于第一损失值和第二损失值。
在一些实施例中,该方法还包括:在完成模型训练后,裁剪出训练完成的学生模型;通过学生模型提供服务。
在一些实施例中,教师模型和学生模型为基于用户行为数据进行用户排序的机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210504149.8/2.html,转载请声明来源钻瓜专利网。





