[发明专利]一种深度学习模型训练容错方法、系统、终端及存储介质有效

申请号：	201910820081.2	申请日：	2019-08-31
公开（公告）号：	CN110737504B	公开（公告）日：	2022-10-18
发明（设计）人：	刘娜	申请（专利权）人：	苏州浪潮智能科技有限公司
主分类号：	G06F9/455	分类号：	G06F9/455;G06F11/14;G06N20/00
代理公司：	济南舜源专利事务所有限公司 37205	代理人：	刘雪萍
地址：	215100 江苏省苏州市吴***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种深度学习模型训练容错方法、系统、终端及存储介质，包括：通过设置内部事件实时将模型状态数据保存至容器所在物理节点；获取异常容器的配置信息；获取所述模型状态数据存储路径，并根据所述存储路径和所述配置信息定义容器对象；利用kubernetes根据所述容器对象恢复容器，读取所述恢复容器的模型状态数据恢复容器训练状态。本发明可以最大限度的将训练过程恢复到发生异常前的状态，将异常带来的损失降到最低，极大弥补了容器不稳定在深度学习领域带来的问题。同时该发明极大的提高了aistation在同类产品中的竞争力。
搜索关键词：	一种深度学习模型训练容错方法系统终端存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种深度学习模型训练容错方法，其特征在于，包括：/n通过设置内部事件实时将模型状态数据保存至容器所在物理节点；/n获取异常容器的配置信息；/n获取所述模型状态数据存储路径，并根据所述存储路径和所述配置信息定义容器对象；/n利用kuberentes根据所述容器对象恢复容器，读取所述恢复容器的模型状态数据恢复容器训练状态。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司，未经苏州浪潮智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910820081.2/，转载请声明来源钻瓜专利网。

上一篇：容器服务快照的管理方法和装置
下一篇：一种采用虚拟通道的虚拟存储访问方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度学习模型训练容错方法、系统、终端及存储介质有效

专利文献下载