[发明专利]在线训练方法、装置、系统及计算机可读存储介质在审
申请号: | 201811558958.7 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109635948A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 姜春阳;孔东营 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 唐述灿 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型参数 神经网络模型 梯度信息 计算机可读存储介质 目标模型参数 实时训练 数据对应 在线训练 训练样本数据 在线训练模型 更新 学习 | ||
本公开是关于一种在线训练方法、装置、系统及计算机可读存储介质,属于深度学习领域。所述方法将深度神经网络模型的所有模型参数分成多个部分,当获取到实时的训练样本数据时,采用与该实时训练数据对应的模型参数对该深度神经网络模型进行训练,得到每个模型参数的梯度信息;基于每个模型参数的梯度信息以及与该实时训练数据对应的模型参数,获取至少一个目标模型参数;基于该至少一个目标模型参数以及该每个模型参数的梯度信息,更新该深度神经网络模型,来实现在线训练模型的目的。
技术领域
本公开涉及深度学习领域,尤其涉及一种在线训练方法、装置、系统及计算机可读存储介质。
背景技术
随着科学技术的发展,深度神经网络被广泛的应用在模型的预测中,例如,在搜索、广告和信息流等业务中,采用深度神经网络对样本数据进行训练,以获取预测点击率预估模型。
目前,采用深度神经网络的训练方式主要是离线训练,这种训练方式中,训练使用的日志可能是用户在前段时间的操作日志,使得训练样本缺乏实时性,利用之前的训练样本数据训练模型,只能是在离线模式下训练模型,因此,离线训练的模型不具有实时性。
发明内容
为克服相关技术中存在的问题,本公开提供一种在线训练方法、装置、系统及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种在线训练方法,包括:
基于实时的训练样本数据,获取该训练样本数据对应的模型参数集合,该模型参数集合包括深度神经网络模型的部分模型参数;
基于该训练样本数据以及该模型参数集合,获取该模型参数集合中的至少一个模型参数的梯度信息,每个梯度信息用于指示一个模型参数的更新方向;
基于该至少一个模型参数的梯度信息以及该至少一个模型参数,获取至少一个目标模型参数;
基于该至少一个模型参数的梯度信息以及该至少一个目标模型参数,对该深度神经网络模型进行更新,得到目标模型。
可选地,基于实时的训练样本数据,获取该训练样本数据对应的模型参数集合,包括:
从开源流处理平台中获取实时的训练样本数据;
提取该训练样本数据的至少一个特征;
基于该至少一个特征,获取该至少一个特征对应的模型参数。
可选地,基于该至少一个特征,获取该至少一个特征对应的模型参数,包括:
基于一致性哈希原则以及该至少一个特征,获取该至少一个特征对应的模型参数。
可选地,基于该训练样本数据以及该模型参数集合,获取该模型参数集合中的至少一个模型参数的梯度信息,包括:
采用该训练样本数据以及该模型参数集合中的至少一个模型参数,对本地模型进行更新;
对更新后的本地模型进行计算,得到该梯度信息。
根据本公开实施例的第二方面,提供一种在线训练方法,包括:
训练节点设备在接收到实时的训练样本数据后,向元信息服务器发送参数分片服务器列表请求,该参数分片服务器列表请求包括该至少一个特征;
该元信息服务器基于该参数分片服务器列表请求以及一致性哈希原则,向对应的训练节点设备发送对应的参数分片服务器列表,该参数分片服务器列表用于指示该训练节点设备分配到的参数分片服务器;
该训练节点设备基于一致性哈希原则以及该训练样本数据的至少一个特征,向对应的参数分片服务器发送模型参数请求,该模型参数请求包括该至少一个特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811558958.7/2.html,转载请声明来源钻瓜专利网。