[发明专利]一种机器学习系统、一种机器学习参数服务器及实现方法在审
申请号: | 201811563116.0 | 申请日: | 2018-12-20 |
公开(公告)号: | CN111352915A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 贾润莹;蒋丰泽;王锋;王兴达 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/185;G06F16/11 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 学习 系统 参数 服务器 实现 方法 | ||
1.一种机器学习参数服务器的实现方法,包括:
接收工作节点发送的数据查询请求;
在第一层存储中查询与所述数据查询请求对应的数据;
若查询成功,则将查询出的数据返回给所述工作节点;
若查询失败,则在第二层存储中查询与所述数据查询请求对应的数据,将查询出的数据保存在所述第一层存储中,以及将查询出的数据返回给所述工作节点。
2.如权利要求1所述的方法,其中,该方法还包括:
预先将与高频特征对应的模型参数保存至第一层存储中,或者,将全部模型参数保存至第一层存储中;
其中,所述高频特征是根据对训练数据中各维度特征出现的次数进行统计确定的。
3.如权利要求1所述的方法,其中,该方法还包括:通过HazelCast实现基于内存的第一层存储服务,通过Kudu实现基于磁盘的第二层存储服务;
所述在第二层存储中查询与所述数据查询请求对应的数据包括:通过HazelCast的load接口调用Kudu的scan接口,查询与所述数据查询请求对应的数据。
4.如权利要求1所述的方法,其中,该方法还包括:
根据工作节点上传的数据对第一层存储进行更新;
周期性地生成持久化存储请求,将相应周期内第一层存储中变化的值更新至第二层存储中。
5.一种机器学习参数服务器,包括:
通信单元,适于接收工作节点发送的数据查询请求;
数据处理单元,适于在第一层存储中查询与所述数据查询请求对应的数据;若查询成功,则将查询出的数据返回给所述工作节点;若查询失败,则在第二层存储中查询与所述数据查询请求对应的数据,将查询出的数据保存在所述第一层存储中;
所述通信单元,还适于以及将查询出的数据返回给所述工作节点。
6.如权利要求5所述的服务器,其中,
所述数据处理单元,适于预先将与高频特征对应的模型参数保存至第一层存储中,或者,将全部模型参数保存至第一层存储中;其中,所述高频特征是根据对训练数据中各维度特征出现的次数进行统计确定的。
7.如权利要求5所述的服务器,其中,
所述数据处理单元,适于通过HazelCast实现基于内存的第一层存储服务,通过Kudu实现基于磁盘的第二层存储服务;通过HazelCast的load接口调用Kudu的scan接口,查询与所述数据查询请求对应的数据。
8.一种机器学习系统,包括如权利要求5至7中任一项所述的机器学习参数服务器、多个以分布式计算实现模型训练的工作节点和用于存储训练数据的分布式存储系统。
9.一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如权利要求1-4中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811563116.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光电集成器件
- 下一篇:一种超声三维体数据在线显示及分析方法