[发明专利]模型训练方法及装置、存储介质及电子设备有效
申请号: | 201811601070.7 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109657793B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 周常青;蔡炀 | 申请(专利权)人: | 广州小狗机器人技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟;王宝筠 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种模型训练方法,包括:将多种图片类别以及所述神经网络基础模型分摊至不同的GPU显卡,选取训练样本输入至每个GPU中的子模型中进行训练,确定训练样本在整体模型中属于每个图片类别的得分值的总得分值,并将该总得分值分别反向传输至每个GPU中;依据该总得分值,及训练样本图片在每个GPU中属于各个图片类别的得分值,对整个神经网络模型的损失函数的进行优化直到收敛,当损失函数的输出值满足预设的收敛条件时,也就完成对每个GPU中的训练子模型的训练。本发明提供的训练方法,可使神经网络能够对任意大规模类别的数据集进行训练,且模型数据传递量少,使得训练速度与小规模数据集类别训练相比几乎没有损失。 | ||
搜索关键词: | 模型 训练 方法 装置 存储 介质 电子设备 | ||
【主权项】:
1.一种模型训练方法,其特征在于,包括:选取基础训练模型,并依据所述基础训练模型所需占用的显存大小,选取多个图像处理器GPU;将所述基础训练模型分割为多个训练子模型,并为每个所述GPU分配与其对应的训练子模型;确定目标图片类别集合,所述目标图片类别集合中包含多个图片类别组,每个所述图片类别组中包含多个不同的图片类别;为每个所述GPU分配与其对应的图片类别组;选取训练样本集合,所述训练样本集合中包含多个训练样本图片;从所述训练样本集合中选取训练样本图片分别输入至每个所述GPU中的训练子模型中进行训练,由每个所述GPU中的训练子模型计算所述训练样本图片属于该GPU中各个图片类别的得分值;确定所述训练样本图片在所有所述GPU中属于各个图片类别的得分值的总得分值,并将所述总得分值分别传输至每个所述GPU中;依据所述总得分值,及所述训练样本图片在每个所述GPU中属于各个图片类别的得分值,及预先设定的所述训练样本图片在每个GPU中与各个图片类别对应的标准概率值,对所述基础训练模型对应的损失函数的输出值进行收敛,并在所述基础训练模型对应的损失函数的输出值满足预设的收敛条件时,完成对每个GPU中训练子模型的训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小狗机器人技术有限公司,未经广州小狗机器人技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811601070.7/,转载请声明来源钻瓜专利网。