[发明专利]一种模型更新方法和装置有效
申请号: | 201610645496.7 | 申请日: | 2016-08-08 |
公开(公告)号: | CN107704929B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 谭银燕;周鹏飞;汪芳山 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 更新 方法 装置 | ||
本发明公开了一种模型更新方法和装置,涉及计算机技术领域,用以至少解决因相邻两个更新触发点之间的新增数据的数据特征与之前数据的数据特征之间变化不明显,而导致的该相邻两个更新触发点所触发的两次模型更新中在后的一次模型更新的意义不大,甚至毫无疑义,从而造成的资源浪费的问题。该方法包括:获取在待测触发点所在的窗口内接收到的第一在线业务数据;根据第一在线业务数据的数据特征,构建第一特征序列;确定第一特征序列与至少一个代表切片之间的关联关系;代表切片是根据历史业务数据的数据特征构建的特征序列的切片;若第一特征序列与至少一个代表切片之间的关联关系满足预设条件,则更新当前模型。
技术领域
本发明涉及计算机技术领域,尤其涉及一种模型更新方法和装置。
背景技术
机器学习算法是通过对已知数据进行分析,获得数据模型(下文中称为模型),利用该模型对未知数据进行预测的算法;示例的,利用该模型和待接收的数据进行内容推荐服务等。传统的机器学习算法需要在学习之前,准备好所有的已知数据,且模型一旦获得,就不再更改。
随着在线类业务(例如在线推荐类业务、在线营销类业务等)的发展,数据规模不断增大,数据变化速率越来越快,利用传统的机器学习算法得到的模型不能很好地适应新增的数据的变化规律,使得利用该模型对未知数据的预测的准确率降低。基于此,增量建模技术应运而生。增量建模技术支持利用新增的数据渐进地对已得到的模型进行更新,使更新后的模型更能适应新增的数据的变化规律,从而提高对未知数据的预测的准确率。
目前,增量建模技术提供的模型更新方法如下:获取新增的数据、历史模型和更新触发点;在更新触发点所在的时刻,利用新增的数据更新历史模型,从而训练出新的模型。在增量建模技术中,何时触发模型的更新是一个关键问题,这影响到模型的更新频率及利用模型对未知数据进行预测的准确率。目前,一般将固定时长或固定数据量作为更新触发点,即:若从上一更新触发点所在的时刻至当前时刻之间的时间段达到固定时长,则触发模型进行更新;或,若从上一更新触发点所在的时刻开始新增的数据量达到固定数据量,则触发模型进行更新。
在利用上述确定更新触发点的方法进行模型更新的过程中,若相邻两个更新触发点之间的新增数据的数据特征与之前数据的数据特征之间变化不明显,则会导致该相邻两个更新触发点所触发的两次模型更新中在后的一次模型更新的意义不大,甚至毫无疑义,从而造成资源的浪费。
发明内容
本发明的实施例提供一种模型更新方法和装置,用以至少解决因相邻两个更新触发点之间的新增数据的数据特征与之前数据的数据特征之间变化不明显,而导致的该相邻两个更新触发点所触发的两次模型更新中在后的一次模型更新的意义不大,甚至毫无疑义,从而造成的资源浪费的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
一方面,提供一种模型更新方法,包括:获取在待测触发点所在的窗口内接收到的第一在线业务数据,其中,待测触发点可以是任意一个待测触发点;然后,根据第一在线业务数据的数据特征,构建第一特征序列;确定第一特征序列与至少一个代表切片之间的关联关系,其中,代表切片是根据历史业务数据的数据特征构建的特征序列的切片;若第一特征序列与至少一个代表切片之间的关联关系满足预设条件,则更新当前模型。可见,本发明实施例提供的技术方案中结合了在线业务数据的数据特征、历史业务的数据特征、二者所构建的特征序列之间的关联关系,以及预设条件这些特征,来确定待测触发点是否为更新触发点;与现有技术提供的将固定时长或固定数据量作为更新触发点的技术方案相比,能够减少因相邻两个更新触发点之间的新增数据的数据特征与之前数据的数据特征之间变化不明显,而导致的该相邻两个更新触发点所触发的两次模型更新中在后的一次模型更新的意义不大,甚至毫无疑义的问题,从而节省资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610645496.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器运行状态视频显示设备
- 下一篇:一种资源周期信息展示方法和装置