[发明专利]一种网络训练的数据集缓存方法、装置、设备及存储介质在审
申请号: | 202011357904.1 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112446490A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 赵仁明;陈培 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 丁曼曼 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 训练 数据 缓存 方法 装置 设备 存储 介质 | ||
本申请公开了一种网络训练的数据集缓存方法、装置、设备及存储介质。该方法的步骤包括:统计网络训练集群中未缓存待训练数据集的训练节点在缓存待训练数据集的过程中所需的磁盘性能开销;监控未缓存待训练数据集的训练节点的当前性能参数;基于当前性能参数在网络训练集群中选取满足磁盘性能开销的目的节点;利用目的节点缓存由源节点传入的待训练数据集,以基于目的节点对待训练数据集执行网络训练。本方法确保了训练节点缓存待训练数据集的可靠性,进而确保了网络训练的整体可靠性。此外,本申请还提供一种网络训练的数据集缓存装置、设备及存储介质,有益效果同上所述。
技术领域
本申请涉及深度学习领域,特别是涉及一种网络训练的数据集缓存方法、装置、设备及存储介质。
背景技术
深度学习在当前得到了广泛的运用,深度学习指的是通过大量数据对神经网络进行特征训练,产生具有识别相应数据能力的网络模型。
由于神经网络训练的过程中所使用的样本数据集的多少,直接影响深度学习的效果,因此当前往往以包含有多个训练节点以及数据集存储节点的集群方式,采用多个训练节点共同利用数据集存储节点中的数据集对神经网络进行训练。在训练过程中,不同训练节点中缓存的数据集可能存在差异,并且当前往往存在需要使用多个训练节点基于相同数据集进行神经网络训练的情况,而神经网络训练的整体可靠性也是当前本领域所关注的重点。
由此可见,提供一种网络训练的数据集缓存方法,以确保训练节点缓存待训练数据集的可靠性,进而确保网络训练的整体可靠性,是本领域技术人员需要解决的问题。
发明内容
本申请的目的是提供一种网络训练的数据集缓存方法、装置、设备及存储介质,以确保训练节点缓存待训练数据集的可靠性,进而确保网络训练的整体可靠性。
为解决上述技术问题,本申请提供一种网络训练的数据集缓存方法,包括:
统计网络训练集群中未缓存待训练数据集的训练节点在缓存待训练数据集的过程中所需的磁盘性能开销;
监控未缓存待训练数据集的训练节点的当前性能参数;
基于当前性能参数在网络训练集群中选取满足磁盘性能开销的目的节点;
利用目的节点缓存由源节点传入的待训练数据集,以基于目的节点对待训练数据集执行网络训练。
优选地,在利用目的节点缓存由源节点传入的待训练数据集之前,方法还包括:
判断网络训练集群中是否存在缓存有待训练数据集的源训练节点;
若网络训练集群中存在缓存有待训练数据集的源训练节点,则在源训练节点中选取与目的节点之间的空闲网络带宽最大的目标源训练节点;
相应的,利用目的节点缓存由源节点传入的待训练数据集,包括:
利用目的节点缓存由目标源训练节点传入的待训练数据集。
优选地,当网络训练集群中不存在缓存有待训练数据集的源训练节点时,利用目的节点缓存由源节点传入的待训练数据集,包括:
利用目的节点缓存由网络训练集群中的数据集存储节点传入的待训练数据集。
优选地,统计网络训练集群中未缓存待训练数据集的训练节点在缓存待训练数据集的过程中所需的磁盘性能开销,包括:
基于未缓存待训练数据集的训练节点的硬件性能参数以及待训练数据集的数据属性参数统计得到磁盘性能开销。
优选地,硬件性能参数包括磁盘转速、磁盘平均巡道时间以及磁盘最大传输速率;
待训练数据集的数据属性参数包括平均文件大小;平均文件大小基于待训练数据集的数据总量以及文件总量运算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011357904.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轻质隔热陶瓦及其制备方法
- 下一篇:一种埋放护筒的连接装置及施工方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置