[发明专利]一种模型训练方法和装置在审
申请号: | 202210498837.8 | 申请日: | 2022-05-09 |
公开(公告)号: | CN114841271A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 舒俊华;邢召龙;包勇军;王文生;张克丰;刘倩欣;原武军 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 孙磊;韩黎捷 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 | ||
本发明公开了一种模型训练方法和装置,涉及人工智能领域。该方法的一具体实施方式包括:获取当前训练周期的基准训练模型,利用确定出的所述当前训练周期的多个稀疏特征参数结合当前训练周期的训练用数据训练所述基准训练模型,根据训练结果确定各个稀疏特征参数是否满足特征更新条件,将满足更新条件的作为下一训练周期的稀疏特征参数;通过在模型训练中处理稀疏特征参数,克服了随着训练次数的增加对训练影响较小的稀疏特征会越来越多而导致的资源开销较大,训练效率较低的问题;提高了训练模型的效率和训练效果。
技术领域
本发明涉及人工智能领域,尤其涉及一种模型训练方法和装置。
背景技术
在搜索、广告、推荐等预测场景(例如:预测点击率),需要针对一些预测模型,进行定期的训练,以保持模型的实时性以和提高预测效果。
目前定期训练模型过程中,会训练训练模型所引入的一些稀疏特征,而前一次训练引入的稀疏特征会在后续的训练中一直存在,随着训练次数的增加,对训练影响较小的稀疏特征会越来越多,这就导致模型训练需要比较大的资源开销,并造成训练效率较低。
发明内容
有鉴于此,本发明实施例提供一种模型训练方法和装置,能够获取当前训练周期的基准训练模型,利用当前训练周期的训练用数据训练所述基准训练模型以及所述基准训练模型包含的多个稀疏特征参数,根据训练结果确定各个稀疏特征参数是否满足特征更新条件,将满足更新条件的作为下一训练周期的训练模型的稀疏特征参数;通过在模型训练中处理稀疏特征参数,克服了随着训练次数的增加对训练影响较小的稀疏特征会越来越多而导致的资源开销较大,训练效率较低的问题;提高了训练模型的效率和训练效果。
为实现上述目的,根据本发明实施例的一个方面,提供了一种模型训练方法,其特征在于,包括:获取当前训练周期的基准训练模型;所述基准训练模型具有对应于所述当前训练周期的多个稀疏特征参数;基于所述当前训练周期的训练用数据,训练所述基准训练模型、以及训练所述基准训练模型具有的所述稀疏特征参数;针对每一个所述稀疏特征参数,根据训练结果判断所述稀疏特征参数是否满足预设的特征更新条件,如果是,则将所述稀疏特征参数作为下一个训练周期的稀疏特征参数;否则,删除所述稀疏特征参数。
可选地,所述判断训练结果中所述稀疏特征参数是否满足预设的特征更新条件,包括:确定所述稀疏特征参数对应的生成时间戳;计算当前时间戳与所述生成时间戳之间的时间差值;在所述时间差值小于或等于设定时间阈值的情况下,确定所述稀疏特征参数满足预设的特征更新条件;在所述时间差值大于设定时间阈值的情况下,确定所述稀疏特征参数不满足预设的特征更新条件。
可选地,所述模型训练方法,还包括:针对每一个所述稀疏特征参数,执行下述操作:确定所述稀疏特征参数对应的初始标识;在所述初始标识指示为未初始化的情况下,为所述稀疏特征参数设置设定特征参数;在所述初始标识指示为已初始化的情况下,确定所述稀疏特征参数的参数值;所述基于所述当前训练周期的训练用数据、所述多个稀疏特征参数,训练所述基准训练模型,包括:基于所述当前训练周期的训练用数据、每一个所述稀疏特征参数的设定特征参数或者参数值,训练所述基准训练模型。
可选地,所述判断训练结果中所述稀疏特征参数是否满足预设的特征更新条件,包括:判断训练结果中所述稀疏特征参数的设定特征参数或者参数值是否存在更新,如果存在,则在所述稀疏特征参数的初始标识指示为已初始化的情况下,确定所述稀疏特征参数满足预设的特征更新条件。
可选地,所述模型训练方法,判断出训练结果中所述稀疏特征参数的设定特征参数或者参数值存在更新之后,进一步包括:为所述稀疏特征参数预设的指示访问情况的指标值进行增值操作;在所述稀疏特征参数的初始标识指示为未初始化的情况下,判断所述稀疏特征参数的指示访问情况的指标值的增值结果是否大于设定阈值,如果是,则确定所述稀疏特征参数满足预设的特征更新条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210498837.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低碳含铝冷镦钢冶炼工艺
- 下一篇:一种可拆装插线板